Avainsana-arkisto: visualisointi

Datan visualisoimisen muistilista

Datan visualisoimisella pyritään esittämään numeerista tietoa ymmärrettävämmässä ja näyttävämmässä muodossa. Visualisoinnissa datasta syntyy informaatiota.  Useimmat meistä hahmottavat asioita kuvien kautta paremmin ja pystymme hahmottamaan selkeämmin asioiden välisiä riippuvuussuhteita.

Tämänkertainen blogiteksti listaa asioita, joita visualisointeja tehdessä kannattaa huomioida. Omissa projekteissani datan visualisointiin olen käyttänyt viime aikoina Microsoftin Power BI:tä. Markkinoilla on useita päteviä työkaluja datan visualisointiin, joten ei ole olemassa yhtä oikeaa työkalua järkevän lopputuloksen aikaansaamiseksi. Käyttäjän odotukset työkalua kohtaan määrittelevät pitkälti sen, mikä työkalu sopii hänelle parhaiten.

Tämä kahdeksan kohdan muistilista ei ole kuitenkaan työkalukohtainen, vaan samat ohjeet pätevät myös muita visualisointityökaluja käytettäessä. Esimerkiksi analysoitava data tulee tuntea, jotta visualisointien lopputulos vastaa tarkoitusta. Listaan sisältyvät kohdat ovat tulleet esille käytännön kokemuksen kautta.

1) Tunne visualisoitava data: yksi keskeisimmistä tekijöistä onnistuneeseen lopputulokseen on analysoida visualisoitavaa datajoukkoa. Selvitä, mitä se pitää sisällään, kuinka virheetöntä data on, vaatiiko data muokkaamista tai ymmärrätkö esimerkiksi, mitä tietokantataulujen attribuutteja tulisi käyttää.

2) Varmista käyttötarkoitus: selvitä asiakkaalta tai visualisoinnin toimeksiantajalta, mitä halutaan visualisoida. Rajaa aihe tarpeeksi hyvin, jotta visualisoinnit vastaavat mahdollisimman hyvin toimeksiantoa. Voit tehdä muutamia koevisualisointeja, jotka toimitat asiakkaalle nähtäväksi. Asiakkaan antamien kommenttien perusteella visualisoinneista on helpompi muokata käyttötarkoitusta vastaavia. Varmista samalla, halutaanko dataa päivittää toistuvasti. Tämä vaatii nimittäin eheän tietokantayhteyden. Power BI:ssä on mahdollista määrittää, kuinka usein data päivitetään esimerkiksi SQL-tietokannasta.

3) Suunnittele ja toteuta: ilman suunnittelua edes visualisoinneista ei voi tulla näyttäviä ja informatiivisia. Internetissä on tarjolla valmiita työkalukohtaisia mallivisualisointeja suunnittelun tueksi. Huolellinen suunnittelu tulee säästämään aikaa. Esimerkiksi virheellisiä arvoja tai kokonaisia tietokantauluja ei tarvitse jälkeenpäin korjata, kun korjaus tehdään jo suunnitteluvaiheessa. Ennen kaikkea visualisointeja ei jouduta tekemään uudestaan, kun rakenne, arvojen oikeellisuus ja asiakkaan vaatimukset on tarkistettu suunnitteluvaiheessa. Huolellisen suunnittelun jälkeen voidaan aloittaa visualisointien toteuttaminen.

4) Tarkista datan oikeellisuus: muista, että yksikään visualisointi ei anna luotettavaa kuvaa, jos datan sisältämiä arvoja ei ole tarkistettu kertaakaan visualisointiprosessin aikana. Vertaa visualisointien sisältämiä arvoja datan alkuperäiseen tietokantaan ja tarkista arvojen oikeellisuus. Kysy tarvittaessa dataa hallinnoivalta asiantuntijalta apua oikeiden arvojen selvittämisessä.

5) Kysy itseltäsi ymmärrätkö, mitä visualisointien on tarkoitus esittää: esittämällä itselle kysymyksiä tehdyistä visualisoinneista on helpompi hahmottaa, ovatko ne ymmärrettäviä. Jos en itse ymmärrä, mitä visualisoinnit esittävät ei moni muukaan taju niiden sisällöstä mitään.

6) Pyri yksinkertaisuuteen: useimmat työkalut mahdollistavat monimutkaistenkin visualisointien tekemisen. Samaan näkymään voidaan sisällyttää useita visualisointeja ja tehdä näyttäviä graafeja ja kuvioita. Yksinkertaiset näkymät ovat kuitenkin kaikista ymmärrettävimpiä. Samaan näkymään ei kannata sisältää lukuisia eri visualisointeja. Näkymät on lisäksi järkevää jaotella teemoittain. Tämä lisää näkymien selkeyttä.

7) Kommunikoi asiantuntijoiden kanssa: hyviin käytöntöihin kuuluu, että visualisointeja tehdessä kommunikoidaan datan omistajan tai sen asiantuntijan kanssa, joka tuntee datan. Esimerkiksi liiketoimintayksikkö tietää, mitä visualisoinneilta odotetaan heidän näkökulmastaan katsottuna. Yleensä valitusta datajoukosta tehdyt visualisoinnit esittävät asiat näyttävämmässä ja ymmärrettävämmässä muodossa. Todellinen ja merkittävä informaatio syntyy vasta, kun visualisoinneista voidaan päätellä jotakin uutta. Tämä saattaa kuitenkin edellyttää, että datajoukkoon yhdistetään toinen datajoukko, joka selittää visualisointien tulokset. Esimerkiksi kun joukkoliikenne dataan liitetään väestömäärät asuinalueittain, voidaan päätellä, miksi joiltakin bussipysäkeiltä nousee enemmän ihmisiä bussin kyytiin kuin toisilta.

8) Nauti visualisointien lopputuloksesta: muista nauttia tekemistäsi visualisoinneista. Esittele aikaansaannoksia työkavereillesi ja pyydä palautetta tehdyistä tuotoksista. Tällä tavoin pystyt kehittämään visualisointeja. Jos yrityksessäsi on viestintä- tai markkinointiosasto, kysy heidän mielipidettään tehdyistä visualisoinneista. He ovat kohdealueen asiantuntijoita ja voit saada heiltä uusia näkemyksiä siitä, kuinka visualisoinneista voisi tehdä ymmärrettävämpiä, organisaation brändin mukaisia tai myyvämpiä.

Henri Lindström