Simulointimallit tutkimuksen, ennustamisen ja päätöksenteon apuna

T&Y 3/2021 Artikkeli Elina Pylkkänen

Maailman ja ilmiöiden monimutkaistuessa ja toisaalta tiedon tarpeen sekä tiedon hyödyntämismahdollisuuksien aina vain kasvaessa on ollut suorastaan pakko kehittää ennuste- ja simulointimalleja. Koska tekniikka ja tietovarannot tekevät sen mahdolliseksi, on pullonkaulana enää riittävän resursoinnin lisäksi osaaminen ja luovuus.

Elina Pylkkänen
Laskentamallit ovat tärkeitä, kirjoittaa alivaltiosihteeri ELINA PYLKKÄNEN. ”Jotta voitaisiin laskea taloudellisia vaikutuksia, tarvitaan simulointimalleja, joihin monimutkainen ja kerroksellinen lainsäädäntö keskinäisvaikutuksineen on koodattu.” (Kuva: Maarit Kytöharju)

Varmasti aina poliittiset päätökset lakimuutoksineen sekä kansantalouden ennusteet ovat perustuneet puntaroituihin arvioihin vaikutuksista, mutta parempaa varmuutta on lähdetty hakemaan erilaisia simulointimalleja kehittelemällä. Mikro- ja makrotasoisten mallien rakentamista motivoi keskeisesti myös se, että ilmiöt ovat niin monitahoisia, että yleensä malli toimii työkaluna isommalle tutkija- tai ennusteryhmälle, jolloin osaaminen kootaan yhteen mallin avulla eri asiantuntijoilta.

Malleihin nojautuva päättely antaa vankempaa pohjaa sekä turvaa tietyllä tavalla myös selustaa kritiikkiä kohtaan, kun päättely pohjautuu mallikehikosta saataviin tuloksiin. Tällöin ennusteita pystytään perustelemaan paremmin, vaikka niihin aina sisältyykin oletuksia ja inhimillistä tulkintaa. Mallit tarjoavat myös hyvän ja lajitellun varastotilan tiedoille, joiden varassa ennusteita ja laskelmia laaditaan.

Usein mallin osumatarkkuutta koetellaan siten, että palataan malliversioon takaisin, kun varsinaisia toteumatietoja on saatu ja verrataan tehtyä ennustetta toteutumaan. Tällainen jälkikäteisennuste antaa konkreettista tietoa mallin kehittäjille sen heikoista kohdista ja auttaa kehittämään mallia eteenpäin. Tämä on itse asiassa hyvin tärkeä seurantavaihe, mutta usein se jää tekemättä, ja sen seurauksena malli kehittymättä.

Ammattilaisten laji

Tietotekniikan kehitys on mahdollistanut erilaisten kerättyjen tietoaineistojen hyödyntämisen systemaattisella tavalla sofistikoituneiden laskentamallien avulla. Tilastolliset analyysiohjelmistot ja tekninen kapasiteetti ovat kehittyneet huimasti viimeisen muutaman vuosikymmenen aikana siten, että pullonkaulana laajemmalle mallien hyödyntämiselle on pikemminkin tietoaineistojen kattavuus ja laajuus (tietoyksiköiden määrä ja yksilöitä kuvaavien ominaisuuksien laatu ja määrä) sekä itse laskentamallien rakentamisen taito loogisiksi kokonaisuuksiksi.

Jotta laskentamalli olisi hyvä, tulisi mallissa olla ohjelmoituna kaikki tarkasteltavaan ilmiöön vaikuttavat tekijät. Ja kun tällainen saadaan aikaiseksi, voi myös yksinomaan mallin avulla simuloiminen vaatia käyttäjältään niin paljon tietoa ja taitoa, että lopultakin mallia pystyvät hyödyntämään vain harvat aiheeseen vihkiytyneet asiantuntijat. Osatakseen käyttää mallia, pitää tuntea malliin koodattu lainsäädäntö, tietoaineiston yksilöitä kuvaavat muuttujat ja mallin rakenne ja logiikka, ohjelmointikieli sekä mallin ratkaisuja helpottavat laskentaoletukset. Juuri näiden osaamisvaatimusten takia kullakin simulointimallilla on vain kourallinen käyttäjiä ja siten monet laskentamallit ovat alihyödynnettyjä.

Usein on esitetty sitäkin, että mallien pitäisi voida olla julkisia ja laajan yleisön käytössä. Vaatimus on melkein mahdoton, sillä se vaatii vaihtoehtoisen politiikan simuloijalta myös paljon ymmärrystä lainsäädännön ja esim. tulonsiirtojärjestelmien keskinäisistä riippuvuuksista. Oppositiopuolueetkin joutuvat tilaamaan vaihtoehtobudjettiensa laskelmat eduskunnan tietopalvelun asiantuntijoilta, sillä yhdelläkään puolueella ei ole ainakaan vielä palkattuna asiantuntijoita tähän tarkoitukseen.

Vaikeutta lisää se, että meillä on hyvin paljon kerroksellista lainsäädäntöä, eli lakeja tehdään hyvin usein aikaisempien lakien täydennyksinä – eikä niinkään kumoamalla vanhoja lakeja uusien tieltä. Toisaalta juuri siksi laskentamalleja tarvitaankin: jotta voitaisiin ylipäätään laskea taloudellisia vaikutuksia, tarvitaan simulointimalleja, joihin monimutkainen ja kerroksellinen lainsäädäntö keskinäisvaikutuksineen on koodattu. Tämä päästää siis lainsäätäjän liian helpolla: jos näitä malleja ei olisi, pitäisi lainsäätäjän demokratian nimissä tehdä ymmärrettäviä ja selkeitä lakimuutoksia.

Onnistuneesti on kuitenkin kyetty toteuttamaan kansalaisille interaktiivisia osamallitarkasteluja. Esimerkiksi Verohallinnon veroprosenttilaskuri pystyy hetkessä pyöräyttämään veroerittelyn, kunhan käyttöliittymään syötetään henkilön tarpeelliset ansiotulolajikohtaiset euromääräiset tiedot, ikä, kotipaikkakunta, verovähennykset ja perhetilanne. Mutta tätäkään käyttäen yksittäinen kansalainen ei voi päätellä yhtään mitään muuta veropolitiikkaan liittyvää vaihtoehtomallia, kuin sen mihin kuntaan tulisi muuttaa, jotta ansiotulojen verorasitus olisi pienimmillään. Toisaalta sen tiedon saa jo kunnallisveroprosentteja vertailemalla.

Vielä parempana esimerkkinä yleisön käyttöön suunnatusta simulointimallista on Me-säätiön ja THL:n yhdessä kehittämä tulolaskuri, jonka avulla voi tarkastella ansiotulojen, sosiaaliturvaetuuksien ja asumiskustannusten vaikutuksia käytettävissä oleviin tuloihin esimerkkikotitalouksissa. Tulolaskuri visualisoi käyttäjän valintoihin perustuen kotitalouden tuotannontekijätulot, verot, tulonsiirrot sekä asumiskustannukset. Laskuri mahdollistaa myös ajalliset tarkastelut, sillä käyttäjien on mahdollista tarkastella erilaisten kotitalouksien tulonmuodostusta vuodesta 1994 alkaen. (Ilmakunnas ym. 2019)

Mikrosimulointimallit vero- ja sosiaalipolitiikan apuvälineinä

Mikrosimulointi on mallintamistyökalu, joka käyttää populaation pienimpiä jakamattomia yksiköitä simulointilaskelmissa. Vero- ja tulonsiirtojärjestelmiä simuloivissa malleissa nämä jakamattomat yksiköt ovat ihmisiä, jotka muodostavat kotitalouksia, jotka taas edustavat koko väestöä.

Talous- ja yhteiskuntatieteiden hyödyntämissä mikrosimulointimalleissa mallinnetaan ihmisten tai kotitalouksien käyttäytymistä kun politiikan parametreissa, esim. veroasteissa, tuen määräytymisperusteissa tai tulonsiirtojen tasossa, kompensaatioasteessa tms. tapahtuu muutoksia. Malli simuloidaan analysoimaan politiikkamuutosten vaikutuksia koko väestössä yksilötasolla, ei yksistään keskiarvoista käyttäytymistä, vaan myös koko kohdemuuttujien jakaumaa. Mikrosimulointimalleja on käytetty sen vuoksi juuri siihen, miten muutokset sotu- ja verojärjestelmissä vaikuttavat tulojakauman hännissä.

Mikrosimulointi täydentää perinteisempää taloustieteellistä analyysia, joissa molemmissa on sekä heikkouksia että vahvuuksia. Mikrosimulointi on vaativaa siinä mielessä, että se edellyttää mallintamistaitoja, pääsyn tietoaineistoihin ja tietokonekapasiteettia. Tilastollinen päättely joka liittyy mikrosimulointiin ei poikkea ekonometrisesta mallintamisesta yleensä (Klevmarken 2001). Tyypillisesti simulointimalleilla on iso skaala ja monimutkainen rakenne, tällöin hyvän ja laadukkaan mikrodatan puute nostaa esiin tulkintakysymykset, joilla on erityistä relevanssia mikrosimuloinnissa. On väistämättä otettava kantaa estimointikriteereihin, mallin tulosten kalibrointiin tiettyihin viitearvoihin sekä suoritettava mallivalidointi. Varsinkaan dynaamisissa mikrosimulointimalleissa näitä tarkistuspisteitä ei voi unohtaa, ja mallia joudutaankin usein hallitsemaan ad hoc –ratkaisuilla, etteivät tulokset näyttäisi epärealistisilta.

Varsin paljon malleissa sovelletaan myös satunnaisuutta, eli annetaan yksittäisille tapauksille mahdollisuus poiketa estimoidun parametriyhtälön määräämästä lopputulemasta lisäämällä tiettyä todennäköisyysjakaumaa noudattava satunnaismuuttuja käyttäytymistä ennustavaan yhtälöön. Simulointi ei siten ole ennustamista, vaan siihen liittyy satunnaisuutta, joka itse asiassa voikin olla osuvampi kuvaus politiikkamuutoksen lopputulemasta.

Mikrosimulointi-termi kattaa monen tyyppisiä malleja. Tavallisesti mallit jaetaan staattisiin ja dynaamisiin malleihin, Staattisissa malleissa yksilöt eivät vanhene eivätkä muuta käyttäytymistään, vaikka simuloinnin tarkoitus on edetä ajassa, kun lainsäädäntöön tehdään muutoksia. Staattisessa mallissa vain yksilöiden edustavuus suhteessa koko väestöön muuttuu yli ajan. Sen sijaan dynaamisissa malleissa yksilöt elävät elämäänsä eri vaiheissa, syntyvät, käyvät kouluja, tekevät työuraa, perustavat perheitä, jäävät eläkkeelle ja lopulta päättävät maallisen vaelluksensa. Lisäksi näissä malleissa yksilöt ja perheet reagoivat lakimuutoksiin. Dynaamisilla malleilla pyritäänkin tarkastelemaan järjestelmiä tai lakeja, jotka mallintavat koko elinkaarella vaikuttavia ratkaisuja ja päätöksiä, esim. opintotukeen tai eläkejärjestelmään tehtäviä muutoksia.

Hyvin yleisesti rakennetaan myös malleja, jotka ovat nk. puolidynaamisia malleja. Sillä tarkoitetaan sitä, että yksilöt reagoivat lakimuutoksiin siten, että he maksimoivat uudessa tilanteessa omaa hyötyään. Mallissa hyödynnetään silloin empiirisistä tutkimuksista saatuja kausaalisia käyttäytymisvaikutuksia, joita kuvaavat parametriarvoiksi redusoidut liikahdukset valinnoissa eli nk. joustot. Jos taloudelliset kannusteet muuttuvat, ihmiset reagoivat muutokseen etuaan ajatellen. Kaikki eivät tietenkään muuta käyttäytymistään, mutta keskimäärin vaikutus tietyssä ryhmässä on parametrin ilmaiseman liikahduksen verran.

Suomessa talous- ja sosiaalipolitiikan valmistelussa hyödynnettävät mallit ovat sekä staattisia, puolidynaamisia että dynaamisia. Dynaamiset mallit ovat käytössä eläkejärjestelmän tarkastelussa, puolidynaamiset jatkeet staattiselle pohjamallille ovat käytössä etenkin työllisyysvaikutuksia arvioitaessa, mutta myös ohjaavien verojen muutosten taloudellisten vaikutusten arvioinnissa.

Data ratkaisee

Kaikkein olennaisin tekijä simulointimallien kehittämismotivaatiossa on laadukkaan mikrodatan saatavuus. Juuri tämän vuoksi erityisesti Pohjoismaat ovat olleet eturintamassa kehittämässä staattisia sekä dynaamisia malleja. Tilastokeskukset ovat kyenneet keräämään luotettavaa rekisteritietoa kansalaisistaan useiden vuosikymmenien ajalta. Näitä tietoja on myös täydennetty erilaisilla haastattelututkimuksilla, joilla halutaan saada vieläkin yksityiskohtaisempaa ja tarkempaa tietoa kotitalouksien tilanteesta, esim. kulutuskäyttäytymisestä, asumisolosuhteista, ajankäytöstä, varallisuudesta jne.

VAIKKA NYKYISET TIETOKONEET PYSTYISIVÄT KÄSITTELEMÄÄN VAIVATTA SUURIAKIN DATAMÄÄRIÄ, EIVÄT TILASTOVIRANOMAISET LUOVUTA TIETOKANTOJA TUTKIJOIDEN TAI VIRKAMIESTEN KÄYTTÖÖN.

Mitä enemmän yksilöityä tietoa on kerättynä, sitä korkeammat vaatimukset yksilöiden tietosuojalle on. Vaikka nykyiset tietokoneet pystyisivät käsittelemään vaivatta suuriakin datamääriä, eivät tilastoviranomaiset luovuta tietokantoja tutkijoiden tai virkamiesten käyttöön. Tilastokeskus, joka Suomessa vastaa yksilöitä koskevien tietojen keräämisestä ja yhdistämisestä, luovuttaa vain käyttöoikeuden tietoihin ja simuloinnit tehdään etäajoina valvotuissa olosuhteissa. Tietokannat säilytetään tietoturvallisesti Tilastokeskuksen omilla tai CSC1:n servereillä.

Korkealaatuiset ja laajat tietoaineistomme mahdollistavat myös kaikkea muutakin empiiristä tutkimusta. Maailmalaajuisesti poikkeuksellista on tietokantamme ainutlaatuisuus, tästä voivat vain unelmoida monet Euroopan suuret maat, samoin kuin USA.

Suomi ensimmäisten joukossa

Mikrosimulointimalleja on käytetty lainsäädännön valmistelutyössä apuna jo 80-luvun lopulta lähtien – Suomi etunenässä uuden tekniikan soveltajien joukossa. Uuden laskentavälineen kehittäjät ymmärsivät makrotasoisten mallien riittämättömyyden lainsäädännön mutkistuessa ja kerrostuessa. Lisähaastetta toi myös tarkasti eri ryhmille kohdennetut politiikkatoimenpiteet – esim. yksinhuoltajille maksettavat korotetut tuet tai ansiotuloverotuksen tulolajikohtaiset vähennykset. Esimerkiksi tuloverotuksen ja sosiaaliturvaetuuksien yhteisvaikutuksia on vaikea arvioida ilman määräytymisperusteiden tarkkaa mallintamista. Kaikki ansiotulot – palkka, etuudet ja eläkkeet – ovat veronalaisia ja vaikuttavat myös tulonsiirtojen suuruuteen. Ja vaikka eri lakien yhteisvaikutukset tiedettäisiinkin, ei vaikutuksia voida yleistää, ellei perusteita voida soveltaa todelliseen väestöpohjaan. Edustava yksilö ei riitä kuvaamaan vaikutuksia julkiseen talouteen: kuntien ja valtion tuloihin ja menoihin, eikä vaikutuksia tulonjakoon väestötasolla voida tietää yksittäisten esimerkkitapausten perusteella.

Valtiovarainministeriössä kehitettiin TUJA-malli (nimi viittaa tulonjakoon, VM) ja sosiaali- ja terveysministeriössä SOMA-malli (sosiaaliturvamalli, STM). Vuosia myöhemmin tutkijat alkoivat rakentaa myös akateemiseen tutkimukseen ja koulutustarpeisiin soveltuvaa JUTTA-mallia (Honkanen). Tuorein malli on reilu vuosikymmen sitten rakennettu SISU-malli (simuloitu Suomi, ks. Tilastokeskus), jonka ylläpito ja kehittäminen on keskitetty Tilastokeskukseen. Mallia käyttävät tätä nykyä useat eri tahot, ministeriöt, eduskunnan tietopalvelu, tutkimuslaitokset, jotkut yliopistot ja yksityiset organisaatiot.

Mallin vahvuutena on 15 prosentin edustava väestöotos. Näin voidaan parantaa laskentatarkkuutta huomattavasti ja lisäksi erilaisten toimenpiteiden suunnatummat kohdentamismahdollisuudet ja niiden vaikutusten arviointi paranevat merkittävästi. Myös alueelliset tarkastelut ovat edustavuuden vuoksi mahdollisia.

SISU-mallin kehittämisessä tavoitteena on ollut käyttäjäkunnan kasvattaminen. Mallin hyödyntäminen vaatii kuitenkin käyttäjältään laajaa ja erityistä osaamista. Simulointimallin suvereeni soveltaminen edellyttää tuloverotuksen sekä sosiaaliturvaetuuksien määräytymisperusteiden tuntemusta, perustietoja otosaineiston ja mallin muuttujista sekä mallin struktuurin ja ohjelmointikielen hallintaa. Vaikka mallissa on vuorovaikutteinen käyttöliittymä käyttäjäkynnystä madaltamassa, läheskään kaikkia tulonsiirtojärjestelmiä ei ole mahdollista simuloida valmiiden parametrivalikoiden varassa, vaan käyttäjän on kyettävä monissa tapauksissa menemään kooditasolle käyttöliittymän taakse.

Mikrosimulointimallin tärkeä tehtävä on pystyä analysoimaan tehtävien politiikkatoimenpiteiden vaikutukset tulonjakoon. Jos toimenpiteen tehtävä on muuttaa verotaakan jakautumista tai tulonsiirtojen kohdennusta kun kokonaisuus on kustannusneutraali, malli kykenee hyvin tarkasti laskemaan välittömät vaikutukset kotitalouksien käytettävissä oleviin tuloihin, minkälaiset kotitaloudet häviävät ja mitkä voittavat. Samoin kyetään laskemaan köyhyysriskin muutokset ja gini-kerroin2, joka ilmaisee kuinka tasaisesti tulot ovat jakautuneet väestössä ja kuinka suuri muutos tuloeroja kuvaavassa gini-kertoimessa tapahtuu.

Ei kaikkitietävä oraakkeli

SIMULOINTIMALLIT TEKEVÄT VAIN SEN, MITÄ MAHDOLLISUUKSIA MALLIIN ON RAKENNETTU.

Simulointimallit tekevät vain sen, mitä mahdollisuuksia malliin on rakennettu. Kaikkiin kysymyksiin ei saada vastauksia, mutta erityisen tärkeä apuväline mikrosimulointimalli on lyhyen aikavälin sosiaaliturvan ja verotuksen suunnittelussa. Hyvin tarkat vastaukset saadaan budjettivaikutuksiin ja tulonjakovaikutuksiin. Työllisyysvaikutuksia harvoin pystytään mallin avulla tuottamaan, silloinkin kontrolli on omissa käsissä: millä voimakkuudella eri ryhmät työmarkkinoilla reagoivat lakimuutoksiin työn tarjonnallaan. Taloustieteellisistä ekonometrisista tutkimuksista voidaan ottaa parametriarvoja peilaamaan mallipopulaation käyttäytymistä, mutta silloinkaan ei ole takuuta siitä, että todellisuudessa tälle työpanokselle olisi kysyntää työmarkkinoilla.

Ulkoapäin on malliin syötettävä myös ennusteet ansiokehityksestä, työllisyys- ja työttömyysasteesta, eläköitymisestä ja muista väestömuutoksista (ml. maahanmuutto ja maassamuutto). Koska mikrosimulointimallia käytetään tulevien vuosien voimaanastuvien lakimuutosten vaikutusten arviointiin, on väestön oltava edustava myös niille vuosille, joille ennuste tehdään. Mallissa oleva väestöotos on aina väistämättä parin vuoden takaa (verotus- ym. tiedot valmistuvat viiveellä), ja se on ajantasaistettava kullekin ennustevuodelle edustavaksi. Vaikka otos on poimintahetkellä täysin edustava (sama painokerroin kaikilla otokseen kuuluvilla), on edustavuutta muutettava ajantasaistusprosessissa. Esim. koska eläkeläisiä on vuosi vuodelta aina enemmän, on mallipopulaation eläkeläisille annettava kasvava edustavuuskerroin jatkovuosille.

Ajantasaistuksessa makromallit ja mikromallit kohtaavat. Talouden ennuste tuotetaan makromalleilla, ja nämä makroluvut viedään mikrosimulointimallin oletuksiin väestö- ja tulokehityksestä seuraaville vuosille. Feedback kulkee tosin myös vastakkaiseen suuntaan. Olisi epärealistista olettaa, ettei politiikkamuutoksiin reagoitaisi yksilötasolla, jolloin nämä mikrotasolla tapahtuvat muutokset johtavat makrokuvan muutoksiin. Miksi tehdä esim. työllisyyspolitiikkaa, jos sillä ei ole vaikutusta kotitalouksien tuloihin ja julkistalouden menoihin ja tuloihin?

Staattinen mikrosimulointimalli on siis parhaimmillaan, kun ennusteperiodi on mahdollisimman lyhyt, eivätkä. mahdolliset lainsäädäntömuutokset ehdi vaikuttaa käyttäytymiseen. Mallin tarkkuus perustuu siihenkin, että työmarkkinoilla tapahtuvat muutokset ovat hyvin maltillisia johtuen jäykkyyksistä työsuhteissa. Työaikaa ei voi yksipuolisesti muuttaa useinkaan, eikä työllistymishalukkuus aina materialisoidu työpaikaksi.

On mitattava myös ei-taloudellisia suureita

Ihanteellista olisi, jos meillä olisi simulointimalli, joka käsittäisi koko julkisen sektorin uudelleenjaon suhteessa yksilöihin ja kotitalouksiin, eli etuuksien ja tuloverotuksen lisäksi kaiken välillisen verotuksen ja hyvinvointipalvelujen käytön. Haastetta siis riittää edelleen.

Ihanteellista olisi, jos meillä olisi simulointimalli, joka käsittäisi koko julkisen sektorin uudelleenjaon suhteessa yksilöihin ja kotitalouksiin.

Hyvinvointipalveluista saatavaa hyötyä on vaikea mallintaa, sillä kaikilla on mahdollisuus hyödyntää universaaleja julkisia palveluja, mutta aina niitä ei tarvitse (Pylkkänen & Sallila 2011). Sairaanhoidon palvelut antavat niitä hyödyntäville suuria kustannuksia vaativia palveluja, joiden arvottaminen euromääräisinä henkilöiden hyväksi on erittäin vaikeaa, eikä euroja potilaalle välitykään, vaikka palvelusta saatava hyöty olisi mittaamattoman arvokas. Samoin vanhuspalvelujen tuotantokustannusten mukainen allokointi palvelunsaajalle euromääräisenä hyötynä tekisi palvelutalon asukkaista nopeasti miljonäärejä, eikä se kuitenkaan kuvaa totuutta suhteessa muuhun väestöön.

Loogista olisi, jos tarjolla olevista universaalisista julkisista palveluista voisi kohdentaa samaan ikäluokkaan kuuluville henkilöille yhtä suuri keskimääräinen palvelusubventio henkilökohtaisista muista ominaisuuksista riippumatta (Aaberge & Langorgen 2006). Tätä menetelmää kutsutaan vakuutusperiaatteeksi, koska jokaisella samaan viiteryhmään kuuluvalla yksilöllä on yhtäläinen mahdollisuus hyötyä palveluista. Tällöin hyöty jakautuu tasaisesti kaikkien tiettyyn ryhmään kuuluvien kesken, vaikka todellisuudessa käytössä olisikin eroja.

Mallit ovat siten parhaimmillaan, kun mitataan taloudellista hyvinvointia tai pikemminkin vain ostovoimaa ja sen muutoksia vuosittain. Hyvinvointia vaurauden ja sosiaalisten suhteiden muodossa – saati sitten onnellisuutta – ei voida simulointimalleilla arvottaa eikä ennustaa.

Simulointimallien tulevaisuuden ennustaminen

MALLIT, DATA JA MALLINTAMINEN KEHITTYVÄT KOKO AJAN UUSIIN SUUNTIIN JA AINA UUSIA RAJOJA ETSIEN.

Mallit, data ja mallintaminen kehittyvät koko ajan uusiin suuntiin ja aina uusia rajoja etsien. Tekoälyn ja big datan esiinmarssi on jo nähtävissä. Ennakointimalleja, joissa tekoäly yrittää löytää valtavista tietomassoista säännönmukaisuuksia tai korrelaatioita, voidaan rakentaa havaitsemaan esimerkiksi kulutuskäyttäytymisen hiljaisia signaaleja ja hyödyntää niitä esim. tulevaisuuden koulutustarpeiden suunnittelussa (Merilehto & Syväniemi 2020).

Verohallinnossa yritetään tavoittaa fuskaajat käyttämällä apuna tekoälypohjaista päättelyä eri tietokantojen ristiinpeilaamisessa ja löytämään loogisia epäjatkuvuuksia. Varsinaisia malleja ei näissä tapauksissa tarvitse rakentaa, mutta alkusyöttö tai algoritmi, josta koneäly jatkaa, tulee antaa.

Uusi tapa ennakoida käänteitä taloudessa on nowcasting, jolla ennustetaan nykyisyyttä tai lähitulevaisuutta talouden indikaattorien avulla. Nowcasting ennustemallien käytöllä voidaan merkittävästi lyhentää talouden tilaa kuvaavien tilastojen julkaisuviivettä. Ennustemenetelmä eroaa perinteisistä tilastotuotannon menetelmistä, sillä kyseessä on tekoälyalgoritmeilla tuotettu ajantasainen ennuste (Fornaro & Luomaranta 2018).

Varmaa on, että myös perinteiset mikrosimulointimallit tulevat kehittymään paremmiksi, koska kerätty tietomäärä kasvaa koko ajan. Nyt alkaa olla saatavilla koko ihmisen elinkaaren pituista dataa, jota voidaan hyödyntää dynaamisissa malleissa. Suuntana on myös mikro- ja makromallien yhdistämisestä saatavat uudet ratkaisut. Kaikkia kehityssuuntia ei voi edes arvata, koska todennäköisesti se olisi jo toteutettu. Se, mikä on käsitteellisesti kuvattavissa, on todennäköisesti myös toteutettavissa.

Kirjoittaja

Elina Pylkkänen
alivaltiosihteeri
TYÖ- JA ELINKEINOMINISTERIÖ
elina.pylkkanen at gov.fi

Elina Pylkkänen on koulutukseltaan taloustieteen tohtori. Hän työskentelee työ- ja elinkeinoministeriön alivaltiosihteerinä. Aiemmin hän toimi Palkansaajien tutkimuslaitoksen johtajana. Tätä aiemmin hän on työskennellyt vuosina 2008–2018 valtiovarainministeriössä finanssineuvoksena. Sitä ennen hän on ollut vanhempana ekonomistina OECD:ssa Pariisissa ja vierailevana tutkijana Stanfordin yliopistossa. Lisäksi hän on muun muassa työskennellyt Ruotsin valtiovarainministeriössä erityisasiantuntijana vuosina 2000–2007.

Viitteet

1 CSC – Tieteen tietotekniikan keskus Oy on Espoon Keilaniemessä sijaitseva Suomen valtion ja korkeakoulujen omistama, opetus- ja kulttuuriministeriön hallinnoima voittoa tavoittelematon osakeyhtiö.

2 Gini-kerroin on yleisin tuloeroja kuvaava tunnusluku. Mitä suuremman arvon Gini-kerroin saa, sitä epätasaisemmin tulot ovat jakautuneet. Gini-kertoimen suurin mahdollinen arvo on yksi. Tällöin suurituloisin tulonsaaja saa kaikki tulot. Pienin mahdollinen Gini-kertoimen arvo on 0, jolloin kaikkien tulonsaajien tulot ovat yhtä suuret. Tulonjakotilastossa Gini-kertoimet esitetään prosentteina (sadalla kerrottuna). Gini-kerroin kuvaa suhteellisia tuloeroja. Gini-kerroin ei muutu, jos kaikkien tulonsaajien tulot muuttuvat prosenteissa saman verran. Lähde: Tilastokeskus.

Kirjallisuus

Aaberge, R. & Langorgen, A. (2006), ”Measuring the Benefits from Public Services – The Effects of Local Government Spending on the Distribution of Income in Norway”. Review of Income and Wealth 52:1.

Fornaro, P. & Luomaranta, H. (2018), ”Nowcasting Finnish Real Economic Activity: a Machine Learning Approach”.

Honkanen, P. (2010), JUTTA-käsikirja Tulonsiirtojen ja verotuksen mikrosimulointijärjestelmä. Kelan tutkimusosasto.

Ilmakunnas, I. & Mukkila, S. & Moisio, P. & Tervola, J. (2019), Tulolaskuri – työkalu kotitalouksien tulojen, etuuksien ja verotuksen visualisoimiseksi. THL Työpaperi 14/2019.

Klevmarken, A. (2001), Micro Simulation – A Tool for Economic Analysis, Working Paper Series from Uppsala University, Department of Economics, No 2001:13.

Merilehto, A. & Syväniemi, A. (2020), ”Analytiikka mullistaa koulutustarpeen paremman ennustettavuuden”, Talous & Yhteiskunta 4 / 2020.

Pylkkänen, E. & Sallila, S. (2011), Hyvinvointipalveluista saatavan hyödyn määrä ja kohde. Valtioneuvoston raportteja 10 / 2011.