Datan jakamisen sietämätön keveys

Julkaisuajankohta 27.4.2017 6.26
Kolumni
Kodakia käytetään esimerkkinä digitaalisesta disruptiosta. Kuvien digitointi ei sinällään ollut mullistus vaan se, että kotialbumin sijaan valokuvia pystyttiin levittämään. Sama murros on tapahtumassa datataloudessa: varastoinnin sijaan arvo syntyy jakamisesta.

Maailman yleisin käyttöjärjestelmä on avoin. Avoimuus tarkoittaa jakamista. Linux on jakanut ytimensä eli lähdekoodin. Arvo syntyy kehityksestä, jota koodilla tuotetaan. Samoin datassa, jonka jalostaminen tuottaa arvon. Esimerkiksi liikennepalvelulain tarkoitus on siten avata tietorajapintoja, sillä uudet liikkumisen palvelut ja matkaketjut edellyttävät datan yhdistämistä.

Asiakasdata nähdään uniikkina. Asiakkaat eivät ole kuitenkaan vain sinun, vaan jaettuna myös muiden. Kokonaiskuva on vain henkilöllä itsellään. Siten tietosuoja-asetuksen antama oikeus itseään koskevaan dataan ja sen siirtämiseen on mahdollisuus henkilötiedon laajempaan hyödyntämiseen. Finanssiala on sopeutumassa muutokseen myös maksupalveludirektiivin myötä. Pankeille vaatimus avata asiakastilien rajapinnat tarjoaa samalla pääsyn kilpailijan asiakkaisiin.

Datan määrä kasvaa, mutta silti datan saatavuus on palvelukehityksen rajoite. Klassinen seuraus tästä on ns. katulamppuefekti, jossa ihminen etsii puistoon hukkaamiaan avaimia lampun alta, koska valaistulta alueelta hän voi avaimen löytää. Valon kohdetta tulisi laajentaa yli organisaatiorajojen, jolloin ratkaisuja etsitään laajemmalla datalla. Yksittäisellä yrityksellä ei ole usein tarpeeksi dataa, jotta koneen opettaminen olisi järkevää.

Teimme selvityksen yritysten tarpeista datan anonymisointiin. Oletuksena oli, että yrityksillä on tarve palveluihin, joiden avulla ne voivat massamuotoisesti hyödyntää dataa, josta henkilö ei ole enää tunnistettavissa. Tilastokeskus tarjoaa tällaista palvelua tutkimukselle. Haastattelut eivät tuoneet oletukselle kuitenkaan vahvistusta. Anonymisointi nähdään tärkeäksi, mutta datan käsittelyä ei haluta antaa yrityksen ulkopuolelle.

Yritykset haluaisivat selkeitä ohjeita siitä, milloin henkilötiedon anonymisointi on riittävää. Data on sidonnaista käyttöyhteyteen, joten yhtä yleistä ratkaisua ei ole. Eikä anonymisointia tule nähdä kertaluonteisena toimenpiteenä. Yrityksellä tulee olla käytänteitä, joilla se hallitusti käsittelee ja seuraa henkilötiedon käsittelyä vaatimusten mukaisesti sekä kykyä arvioida tietojen anonymiteettiä säännöllisesti. Osoitus tietosuojasta huolehtimisesta on yrityksen paras vakuutus.

Datan jakaminen edellyttää oikeuksien ja vastuiden tasapuolista määritystä. Datayhteistyö estyy usein jo etukäteen, kun pelkästä naapurikateudesta tai luottamuksen puutteesta nousee kiista hyödyistä. Jakamistaloudessa arvo syntyy, kun panostuksia voidaan osittaa ja maksut määräytyvät käytöstä. Palveluista tulisi sekä datan tuottajille että käyttäjille järkeviä.

Anonymisoidun datan käyttökohteita riittää. Tietoa analysoiden voitaisiin esimerkiksi löytää terveysriskejä, syrjäytyviä nuoria, kehittää liikenteenohjausta, koulutussuunnittelua tai markkinointia, optimoida energiankulutusta, paljastaa petoksia, ennakoida taloutta tai kertoa miten verenpaineeni suhteutuu verrokkikansalaiseen.

Tulevaisuus on datan hyödyntämisessä ihmisten palvelemiseksi. Se on ”on-demand”- palveluja, jotka vastaavat käyttäjän tarpeeseen tarvittaessa. Se on dataa yhdistelevien ympäristöjen, joissa robotit auttavat murskaamalla dataa. Ei ole järkeä, että kone opetetaan lukemaan datalla, joka nollataan seuraavaa asiakasta varten. Tekoälyn tarjoamaa oppimisetua ei kannata hukata vain sillä, että valmius datan jakamiseen puuttuu.

Kirjoittaja on viestintäneuvos liikenne- ja viestintäministeriön Tietoliiketoimintayksikössä. 
Julkaisu:    Anonymisointipalvelut. Tarve ja toteutusvaihtoehdot (LVM:n julkaisuja 7/2017)
2017 Blogit Blogit 2017 automaatio automatisaatio digitalisaatio liikenne liikenne palveluna tutkimus viestintä viestintäpolitiikka