Tutkijoiden on varauduttava ottamaan enemmän vastuuta tilastojen jatkuvuudesta
Tilastokeskuksen tutkijapalvelusta on vuosien saatossa kehittynyt tärkeä tutkimuksen perusinfrastruktuuri. Rahoitusleikkausten takia tutkijoiden on varauduttava ottamaan tulevaisuudessa enemmän vastuuta tilastotoiminnan jatkuvuuden turvaamisesta, Tilastokeskuksen pääjohtaja Markus Sovala kirjoittaa.
Pohjoismaalaisen tilastotuotannon erikoisuus ja monella tavalla hieno saavutus on kaikille julkisten virallisten tilastojen ja salassa pidettävien, yksilötietoja sisältävien tutkimusaineistojen yhteistuotanto. Palvelu- ja tulonsiirtotuotannossa kertyneistä rekisteritiedoista muokataan YK-normien mukaisia tilastoja, ja niistä media tiedottaa aamusta toiseen ”Tilastokeskuksen mukaan…”. Samat tiedot ovat tutkimuksen käytössä.
MARKUS SOVALA
Markus Sovala on valtiotieteiden tohtori ja työskentelee Tilastokeskuksen pääjohtajana.
Aiemmin hän on toiminut valtiovarainministeriössä johtavissa tehtävissä ja mm. pääministeri Paavo Lipposen talouspoliittisena erityisavustajana, muutosjohtajana Sipilän hallituksen maakuntauudistuksessa sekä Suomen edustajana Maailmanpankin hallinnossa Washingtonissa.
Aina ei ole ollut näin. Rekisteripohjainen tilastointi sai alkunsa, kun valtavan työmäärän vaatineista ja siksi kalliista väestölaskennoista luovuttiin 1980-luvulle tultaessa. Tämän mahdollistivat asteittain parantuneet väestörekisterin tiedot. Viranomaistiedon arvo huomattiin myös akateemisessa tutkimuksessa ja tilastoyhteisössä. Ensimmäinen tutkimuskäyttöön tarkoitettu yhdistetty väestölaskenta- ja kuolleisuusaineisto valmistui Tilastokeskuksessa vuonna 1978. Siinä yhdistettiin tiedot kaikista Suomessa vuosina 1971–1975 kuolleista vuoden 1970 väestölaskennan henkilötietoihin.
Muutamassa vuosikymmenessä tilastotuotanto on mullistunut täysin. Valtaosa tilastotuotannon vaatimasta ”raaka-aineesta” saadaan julkisen hallinnon rekistereistä. Toki ihmisiltä kysytään mielipiteitä ja yrityksiltä suunnitelmia – ja joitain niin yksityiskohtaisia tietoja, etteivät muut viranomaiset ole niitä keränneet – mutta lähes kaikki faktatiedot kerätään sähköisesti, vähintään puoliautomaattisesti.
Sama aineisto on empiirisen yhteiskunta- ja taloustutkimuksen nykyinen pääasiallinen tietolähde. Tilastokeskus on 2000-luvun alkupuolelta asti mahdollistanut tietojen käytön tietoturvallisessa etäkäyttöympäristössä Fionassa. Vaikka aineisto on pseudonymisoitua, sen käyttö edellyttää yksityiskohtaista tutkimuslupaa ja aineiston rajaamista minimaaliseksi, kattamaan vain aivan välttämättömimmät tiedot tutkimusongelmiin vastaamiseksi.
Tutkijapalvelusta tuli perusinfraa
Tutkijapalvelu on laajentunut, ja sitä hyödyntää yli 1 300 tutkijaa yli 300 tutkimushankkeessa, ja nyt toiminnan kustannukset ovat noin 5,5 miljoonaa euroa vuodessa. Tutkijapalvelusta on tullut keskeinen tutkimuksen perusinfrastruktuuri, vaikka sen asema tunnistettiinkin virallisesti vasta vuonna 2023, kun tutkijapalvelusta tuli Tilastokeskuksen lakisääteinen tehtävä. Samalla tutkijapalvelusta on tullut tärkeä suhteellinen etu suomalaiselle yhteiskunta- ja taloustutkimukselle. Tilastokeskus ylläpitää tätä tutkimuskäyttöä varten noin 70:tä keskeisistä rekisteritiedoista koottua valmisaineistoa, joiden tietosisältö on vakioitu, kuvattu ja säännöllisesti päivitettävä. Vastaavia hyvälaatuisia, nopeasti päivittyviä mikroaineistoja ei Pohjoismaiden ulkopuolella ole juuri saatavilla.
Globaalisti vielä tutkijapalvelua harvinaisempi toiminto on sen varaan rakentuvat päätöksentekoa suoraan palvelevat datahuoneet. Valtioneuvoston datahuoneen mahdollistava lainsäädäntö tuli voimaan 2023. Sen rinnalle on rakentunut pääkaupunkiseudun kuntia palveleva vastaava soveltavan tutkimuksen yhteenliittymä, jonka tarkoituksena on saada yhdistettyä kaupunkien ja Tilastokeskuksen mikrodatat palvelemaan kaupunkipolitiikan suunnittelua ja arviointia.
Tilastojen ja tutkimuksen – niin akateemisen kuin soveltavankin – onnellinen yhteiselo on joutumassa uuden tilanteen eteen, kun Tilastokeskuksen rahoitusta on leikattu osana valtiontalouden sopeutustoimia. Orpon hallituksen päätöksin vuosittainen rahoitus supistuu 2020-luvun puolivälissä ja sen jälkeen noin 15 prosentilla.
Koska useista eri syistä Tilastokeskuksen ICT-investointeja ei voida supistaa, henkilöstön määrään kohdistuu yli 20 prosentin vähentämispaine, josta on 2026 mennessä toteutumassa jo 13 prosentin vähenemä. Tämän seurauksena tilastotuotantoa joudutaan merkittävästi supistamaan. Koska valtaosa tilastotuotannosta perustuu EU-lainsäädäntöön ja on siten pakollista, vähenemä tulee keskittymään siihen osaan tuotantoa, josta ei ole sitovaa lainsäädäntöä ja jonka motivaationa on kansalliset tietotarpeet.
Maksuja joudutaan nostamaan
Orpon hallituksen säästöpäätökset koskevat osin jo seuraavaa, vuonna 2027 alkavaa hallituskautta. Ottaen huomioon julkisen talouden tilanteen, on mahdollista, että uusi hallitus voisi yrittää hakea lisäsäästöjä ”valtionhallinnosta” ja siten myös Tilastokeskuksesta. Voi ennakoida, että tilastotuotannon resursseihin kohdistuva paine tulee jatkumaan, ja yhä laajempi osa siitä on supistamisten, keskeytysten tai pysyvän lopetusuhan alla.
Tilastokeskuksen rahoituksen supistumisella on ainakin kaksi eri vaikutusmekanismia tutkimukseen. Ensinnäkin tutkijoilta ja tutkimushankkeilta perittäviä maksuja joudutaan nostamaan. Vaikka tutkijapalvelu oli alun perin tarkoitettu maksuperustelainsäädännön mukaisesti kattamaan omat kustannuksensa asiakasmaksuin, tästä on vuosien ajan livetty. Vuoden 2026 osalta kustannusvastaavuuden ennakoidaan olevan noin 60 prosentin tasolla. Siten palvelua rahoitetaan tilastotuotannolle tarkoitetusta talousarviomäärärahasta. Tilastokeskuksen rahoituksen supistuessa tämä ei ole enää mahdollista.
Kun tilastotuotantoa joudutaan rahoituksen kutistuessa supistamaan, myös sitä varten voidaan kerätä ja jalostaa aiempaa vähemmän ja suppeammin tietoaineistoja.
Toinen, hitaammin vaikuttava kehityssuunta koskee datan saatavuutta. Kuten edellä on kuvattu, tutkimus on saanut asteittain käyttöönsä tilastotuotantoon kerätyt ja ”esijalostetut” tietoaineistot. Kun tilastotuotantoa joudutaan rahoituksen kutistuessa supistamaan, myös sitä varten voidaan kerätä ja jalostaa aiempaa vähemmän ja suppeammin tietoaineistoja.
Ei ole mahdotonta, että tilastojen ja tutkimusaineistojen suhde kääntyy asteittain päälaelleen: kun aiemmin tutkimus saattoi turvata vahvaan tilastotuotantoon, nyt se joutuu asteittain ottamaan vastuuta ja oman etunsa vuoksi vaatimaan tilastotuotannon jatkuvuuden turvaamista.