Mitä annettavaa tekoälypohjaisella ennustamisella on taloustieteessä?

T&Y 3/2021 Artikkeli Markku Lehmus, Aleksi Avela, Jetro Anttonen

Saatavilla olevan datan määrän sekä tietokoneiden laskentatehon räjähdysmäinen kasvu viimeisten vuosikymmenten aikana on mahdollistanut tekoälyn hyödyntämisen monenlaisissa sovelluskohteissa: sillä on nykyään myös kasvava rooli talousennusteiden laatimisessa. Niinpä tekoäly – sekä sen mahdollisuudet ja uhat – ovat olleet paljon esillä yhteiskunnallisessa keskustelussa. Tekoäly nähdään kuitenkin usein abstraktina ja läpinäkymättömänä teknologiana, jonka toimintaa ei välttämättä ymmärretä – eikä sen potentiaalia tai ongelmia pystytä täysin hahmottamaan. Tässä artikkelissa pyrimme avaamaan tekoälyn toimintaa sekä sen hyödyntämistä talousennusteissa.

Markku Lehmus, Aleksi Avela, Jetro Anttonen
Talousennusteiden kehittämisessä on kyse ennusteen informaatiopohjan kasvattamisesta, mikä ei tarkoita vain suurempia datamassoja, vaan myös datan älykkäämpää hyödyntämistä, kirjoittavat ETLA:n asiantuntijat MARKKU LEHMUS (oik.), ALEKSI AVELA (vas.) ja JETRO ANTTONEN. (Kuva: Maarit Kytöharju)

Tekoälystä ja koneoppivista malleista puhuttaessa on erityisen tärkeää määritellä mihin näillä käsitteillä viitataan. Varsinkin arkikielessä näitä termejä käytetään hyvinkin erilaisissa tilanteissa ja merkityksissä. Tekoäly ja koneoppiva malli eivät myöskään ole synonyymejä, vaikka usein arkipuheessa tekoälystä puhuttaessa viitataankin juuri koneoppivaan tekoälyyn.

Yksinkertaisimmillaan esitettynä tekoäly on tietokonealgoritmi, jonka tavoitteena on toimia jossain mielessä tai jollakin mittarilla ”älykkäästi”. Usein älykkäänä pidetään algoritmia, joka pystyy replikoimaan mahdollisimman tarkasti ihmisen toimintaa vastaavassa tilanteessa. Tällöin tekoälyn hyöty on sen nopeus verrattuna ihmiseen, sekä kyky toimia automaattisesti, jolloin ihmisen aika säästyy mielekkäämpiin tehtäviin. Roskapostifiltteri on hyvä esimerkki tekoälystä, joka pyrkii samankaltaisiin ratkaisuihin kuin ihminen, mutta paljon nopeammin ja automaattisesti. Toisaalta tekoälyn etu voi myös olla sen valtava muisti ja kyky käsitellä tehokkaasti lukemattomia määriä erilaisia skenaarioita. Tällöin tekoäly ei pyri kopioimaan ihmisen toimintaa, vaan tekemään jollain mittarilla optimaalisia ratkaisuja: esimerkiksi ristinollaan on mahdollista tuottaa voittamaton tekoäly.

Tekoäly voi perustua, tai olla perustumatta, koneoppimiseen. Esimerkiksi yllä mainittu ristinolla on yksinkertainen peli, joka on mahdollista ”ratkaista”, eli sitä pelaava tekoäly voidaan toteuttaa matematiikan ja logiikan keinoilla, jolloin koneoppimista ei tarvita. Koneoppiva tekoäly sen sijaan on malli, jonka rakenne on määritelty ennalta, mutta sen parametrit pyritään ”oppimaan” esimerkkiaineistosta. Oppimisella tarkoitetaan tässä kontekstissa parametrien optimoimista jonkun virhe- tai tavoitefunktion suhteen. Toisin sanottuna, tekoäly valitsee (eli ”oppii”) sellaiset parametrien arvot, joilla annetulla mallin rakenteella tulokset ovat mahdollisimman lähellä toivottuja.

Tässä tekstissä ja talousennustamisen kontekstissa yleensä puhumme nimenomaan koneoppimisesta tai koneoppivasta tekoälystä. Tyypilliset tekoälyn sovelluskohteet, kuten vaikka talousennustaminen, ovatkin huomattavasti aiemmin mainittua ristinollaa monimutkaisempia kokonaisuuksia, joiden käsittely vaatii erilaista lähestymistapaa. Koneoppiva tekoäly käyttää dataa oppiakseen mielenkiinnon kohteena olevasta ilmiöstä. Mitä enemmän dataa on, sitä vähemmän koneoppiva tekoäly tarvitsee ennalta määriteltyä rakennetta – toisin sanottuna, sitä enemmän opittavia parametreja se voi sisältää. Ennalta määritellyllä rakenteella tarkoitetaan tutkijan tekemiä oletuksia ilmiöön sekä sen mahdollisiin riippuvuussuhteisiin liittyen.

Ennalta määritellyn rakenteen ja oletusten määrä on oleellisin koneoppimista ja klassisempia tilastollisia ja taloustieteellisiä menetelmiä erottava tekijä. Kattoterminä niin koneoppimiselle kuin klassisemmille dataa käyttäville menetelmille voidaan käyttää termiä ”tilastollinen oppiminen”. Koneoppimisessa ja klassisemmassa tilastotieteessä on siis pohjimmiltaan kyse samasta asiasta. Vaikka koneoppiminen vaatii tietyssä mielessä vähemmän rakennetta ja oletuksia, ei tätä pidä kuitenkaan ymmärtää niin, ettei koneoppivilla malleilla olisi ennalta määriteltyä rakennetta tai etteikö niiden käyttäminen vaatisi oletuksia. Erilaiset mallit sisältävät erilaisia oletuksia ja mahdollistavat erilaisen datan hyödyntämisen. On myös hyvä huomata, että mikään malli ei voi oppia sellaisia parametreja tai riippuvuuksia, joita sen rakenne ei sisällä.

Koneoppivat mallit toimivat erityisen hyvin, kun dataa on paljon ja ne voivat kyetä hyödyntämään myös esimerkiksi kuva- ja tekstimuotoista dataa. Esimerkiksi silloin kun dataa on paljon, eikä tutkija kykene teorian pohjalta muodostamaan luotettavaa käsitystä siitä, mitkä muuttujat ovat tärkeitä ja mitkä eivät, koneoppivat mallit voivat osoittautua erittäin hyödyllisiksi (ks. esim. Coulombe et al. (2020)). Toisaalta kun dataa on vähemmän, johtaa rakenteeltaan rajoitetumpi malli usein parempaan lopputulokseen.

Koneoppiminen ja talousennusteet

Esimerkiksi Suomessa talousennusteita laaditaan useilla eri tahoilla ja erilaisia ennusteita on näin ollen saatavilla lukuisia. Ennusteiden erilaisuus ei kerro niiden heikkoudesta, vaan on päinvastoin hyvä asia. Eri tahoilla on erilaisia näkemyksiä ja niillä saattaa olla käytössään ainakin jonkin verran toisistaan poikkeavaa informaatiota, mikä johtaa hieman erilaisiin ennusteisiin. Tutkimuskirjallisuuden perusteella tiedetään, että usein eri ennusteiden yhdistäminen johtaa tarkempaan ennusteeseen kuin yksittäisten ennusteiden käyttäminen. Tähän päätelmään tulee esimerkiksi Wallis (2011), joka käy läpi kirjallisuutta ennusteiden yhdistämisen hyödyllisyydestä. Päätelmä on sama kuin Batesilla & Grangerilla (1969), jolloin he jo verraten varhain artikkelissaan päättelivät, että kahden kilpailevan ennusteen lineaarikombinaatio johtaa parempaan ennustetarkkuuteen kuin yksittäinen ennuste.

Suomessa julkaistaan siis toisistaan hieman poikkeavia ennusteita, jotka yhdessä muodostavat mahdollisimman hyvän kuvan siitä, miten taloudellinen tilanne tulee todennäköisimmin tulevaisuudessa kehittymään. Myös julkaistut ennusteet itsessään muodostuvat erilaisista näkemyksistä, malleista ja informaatiosta. Kuten jo mainittua, erilaisten tulokulmien summa johtaa yleensä parempaan lopputulokseen kuin yksikään tulokulma yksinään. Koneoppivat mallit rikastavat talousennusteita tarjotessaan uuden tavan tulkita jo olemassa olevaa dataa samalla kun ne toisaalta mahdollistavat myös täysin uudenlaisten datalähteiden hyödyntämisen ennustamisessa.

Karkeasti ottaen talousennusteiden tavoitteena on vastata kahteen kysymykseen. Miten talous tulee nykytiedon valossa todennäköisimmin kehittymään tulevaisuudessa (ns. piste-ennuste), ja kuinka todennäköisiä ovat erikokoiset ennustepoikkeamat (eli nykytiedon valossa todennäköisimmän kehityskulun ja todellisuudessa toteutuvan kehityskulun erotus). Talousennusteiden on pitkään tulkittu vastaavan vain ensimmäiseen kysymykseen, mikä on voinut johtaa väärinkäsityksiin koskien talousennusteiden luonnetta sekä hyödyllisyyttä. Jos ennusteen tulkitsee epäonnistuneeksi todennäköisimmäksi ennustetun kehityskulun poiketessa vähääkään toteutuneesta, on ennuste tuomittu epäonnistumaan käytännössä aina. Lienee kuitenkin sanomattakin selvää, ettei tällainen ennuste kuitenkaan ole hyödytön.

Toinen kysymys, koskien ennustepoikkeamia tai ennuste-epävarmuutta, on jäänyt tyypillisesti pienemmälle huomiolle talousennusteista keskusteltaessa, vaikka sen merkitys päätöksenteon kannalta voi olla jopa edellistä suurempi. Tämä epäkohta kumpuaa sekä viestinnällisistä että menetelmällisistä seikoista, sillä niin epävarmuudesta puhuminen kuin sen käsittely on huomattavasti haastavampaa, kuin piste-ennusteen tapauksessa. Tietokoneiden laskentatehon kasvaminen ja koneoppimisen kehittyminen ovat kuitenkin osaltaan helpottaneet ennuste-epävarmuuden käsittelyyn liittyviä menetelmällisiä haasteita.

Pohjimmiltaan talousennusteiden kehittämisessä on kyse ennusteen informaatiopohjan kasvattamisesta, mikä ei tarkoita vain suurempia datamassoja, vaan myös datan tehokkaampaa ja älykkäämpää hyödyntämistä, missä koneoppivat menetelmät ovat suureksi hyödyksi. Koneoppivat ja klassisemmat menetelmät eivät ole poissulkevia vaihtoehtoja toisilleen, vaan toisiaan täydentäviä tulokulmia samaan ongelmaan. Talousennuste on parhaimmillaan, kun se hyödyntää mahdollisimman paljon erilaisia menetelmiä ja jopa yksittäiset mallit itsessäänkin sisältävät usein osia, joista toiset voisi luokitella koneoppiviksi ja toiset joksikin muuksi. Rajanveto koneoppiviin menetelmiin ja muihin menetelmiin ei aina ole talousennusteiden tapauksessa helppoa, eikä toisaalta kovin oleellistakaan.

Miten koneoppimista on jo hyödynnetty talousennustamisessa?

Varhaisimpia talousennustamiseen liittyviä koneoppivia malleja hyödyntävä sovellus on Nakamura (2005), joka pyrki lisäämään inflaatioennusteiden tarkkuutta neuroverkkojen avulla. Sittemmin koneoppivia malleja on käytetty muun muassa työttömyyden (Smalter & Cook 2017) tai vaikkapa Japanin osakemarkkinoiden tuottojen ennustamisessa (Abe & Nakayma 2018). Nämä ovat vain muutamia esimerkkejä kirjallisuudesta ja saatavilla olevien aineistojen koko ajan lisääntyessä sekä tietokoneiden laskentatehon kasvaessa, yleistyy koneoppivien mallien käyttö talousennustamisessa jatkuvasti.

KONEOPPIVIA MALLEJA HYÖDYNNETÄÄN MYÖS YHÄ LAAJEMMIN KAUSAALISUHTEIDEN ARVIOIMISESSA.

Koneoppivia malleja hyödynnetään myös yhä laajemmin kausaalisuhteiden arvioimisessa. Näissäkin tilanteissa koneoppivat mallit ovat parhaimmillaan, kun tutkijalla on käytössään paljon dataa, muttei tarkkaa käsitystä siitä, mitkä muuttujat ovat tärkeitä tai millaisella spesifikaatiolla ilmiötä pitäisi mallintaa. Esimerkkinä katsauksesta koneoppivien mallien sovellusmahdollisuuksiin mainittakoon Atheyn (2017) artikkeli, joka käy läpi, miten ohjattuja koneoppivia malleja sovelletaan jo laajasti eri tieteenaloilla sekä käytännön ratkaisuissa yhteiskunnan eri alueilla. Katsausartikkeli esittelee myös menetelmiin tehtyjä laajennuksia, joiden ansiosta koneoppivilla malleilla voidaan myös arvioida kausaalivaikutuksia tehokkaasti ja harhattomasti.

Ajankohtaisena esimerkkinä tekoälypohjaisen lähestymistavan hyödyntämisestä Suomessa voidaan mainita Etlan taloudellisen epävarmuuden indeksi (Avela & Lehmus 2020). Ajatus indeksin taustalla on, että huonojen talousuutisten (esim. yt-neuvottelut tai lakot) osuus kaikista uutisista kuukauden aikana indikoisi sitä, kuinka epävarmana kuluttajat, yritykset ja päättäjät pitävät vallitsevaa tai tulevaa taloustilannetta. Muodostaakseen indeksin koneoppiva malli luokittelee kaikki uutiset negatiivisiin ja muihin uutisiin niiden taloudellisen sentimentin mukaisesti. Vaikka vastaavan luokittelun toteuttaminen ihmisvoimin olisi mahdollista, vaatisi tuhansien uutisten jatkuva luokittelu kohtuuttoman suuren työpanoksen ja aikaa. Koneoppiva tekoäly mahdollistaa työn automatisoinnin ja työ hoituu sekunneissa.

Koska koneoppivan mallin tarkoituksena on tässä tapauksessa imitoida ihmisen toimintaa, tarvitsee malli toimiakseen harjoitusaineiston, jonka perusteella se voi luokitella uutisia. Malli ei voi pelkkien uutisten perusteella mitenkään tietää, minkälaisia uutisia ihmiset pitävät talouden kannalta positiivisina tai negatiivisina, vaikka se voisi jakaa niitä esimerkiksi erilaisiin ryhmiin. Etlan indeksin tapauksessa harjoitusaineisto on muodostettu niin, että ihmiset ovat lukeneet ennalta määritellyn määrän uutisia ja luokitelleet nämä niiden taloudellisen sentimentin mukaisesti negatiivisiin sekä muihin uutisiin. Mitä enemmän tätä harjoitusaineistoa (eli ihmisten etukäteen luokittelemia uutisia) on, sen paremmin koneoppiva malli pystyy siitä oppimaan. Etlan indeksiä varten harjoitusaineistoa tuotettiin yli 10 000 uutisen verran. Vaikka tuon uutismäärän läpikäynti voi kuulostaa paljolta, tarvitsee se tehdä vain kerran, jonka jälkeen malli kykenee luokittelemaan tuhansia uutisia päivittäin – ilman ihmisen työpanosta. Näin indeksiä voidaan tuottaa pitkälläkin aikavälillä vaivattomasti minimaalisin työpanoksin.

Koneoppivia malleja on kritisoitu läpinäkyvyyden puutteesta ja tulkinnan hankaluudesta, mistä syystä mallien tuottamien tulosten perustelu voi olla jälkikäteen hyvin hankalaa. Vaikka läpinäkyvyys on myös viestinnällinen ongelma, vaikuttaa siihen huomattavasti myös käytetty koneoppimisalgoritmi. Nykypäivänä – kun datamassat ovat valtavia ja tietokoneet alati tehokkaampia – niin sanotut neuroverkot ovat hyvin laajalti käytettyjä koneoppimisalgoritmeja, sillä ne pystyvät oppimaan todella monimutkaisia riippuvuussuhteita hyvin vähäisin oletuksin. Toisaalta ne tuottavat hyvän lopputuloksen vain, kun dataa on todella paljon. Neuroverkkojen ongelmaksi voi muodostua myös niiden heikko läpinäkyvyys: neuroverkko sisältää valtavan määrän abstrakteja parametreja, joiden tulkinta jälkikäteen voi olla ihmiselle käytännössä mahdotonta.

Toisaalta edellä mainittu Etlan indeksi hyödyntää melko yksinkertaista koneoppimisalgoritmia (ns. Naive Bayes -luokittelija, ks. esim. Rennie et al. (2003)), jonka parametrit liittyvät vain harjoitusaineistossa esiintyviin sanoihin. Algoritmin oppimat parametrit liittyvät suoraan siihen, kuinka merkittävänä se pitää uutisessa esiintyvää yksittäistä sanaa suhteessa sen taloudelliseen sentimenttiin. Lopullinen luokitus perustuu todennäköisyyteen, jolla mallin näkökulmasta tietyistä sanoista koostuvaa uutista voidaan pitää negatiivisena talousuutisena.

Etlan indeksin taustalla olevan tekoälyn toiminta on siis huomattavan läpinäkyvää, sillä ihminen voi halutessaan tarkistaa jokaisen sanan saaman painon jälkikäteen ja tehdä tarvittaessa muutoksia algoritmiin. Toisaalta malli on myös melko yksinkertainen, eikä siten pysty juurikaan oppimaan sanojen välisiä riippuvuussuhteita. Etlan indeksissä korkean painon saavat esimerkiksi sanat ”yt-neuvottelu”, ”lomautus” ja ”lakko”; ihminen voi varmistaa näiden sanojen intuitiivisuuden tässä kontekstissa. Toisaalta esimerkiksi sana ”Trump” voi korreloida vahvasti negatiivisten talousuutisten kanssa, vaikkei sillä ja talouden sentimentillä välttämättä olisikaan varsinaista yhteyttä. Näin ollen ihminen voi esimerkiksi päätyä erisnimien poistamiseen datasta, ts. estää tekoälyä oppimasta painoa niille.

Etlan epävarmuusindeksi
Kuvio 1. Etlan epävarmuusindeksi

Kuviossa 1 on esitetty Etlan tekoälyn avulla tuotettu epävarmuusindeksi, jossa aineistona on käytetty Ylen uutisia vuoden 2010 alusta vuoden 2021 huhtikuuhun. Indeksistä voi havaita muun muassa kevään 2010 sekä syksyn 2018 lukuisat työtaistelut, lakot ja yt-neuvottelut, hallituskriisin 2019 loppuvuodesta sekä vuonna 2020 alkaneen koronapandemian.

Lopuksi

Atheyn (2019) mukaan koneoppivilla malleilla tulee olemaan mullistava vaikutus taloustieteeseen hyvin lyhyessä ajassa. Atheyn mukaan koneoppivien mallien keskeinen ”etu” perinteisiin taloustieteen malleihin nähden on se, että edellisissä empiirinen analyysi nähdään algoritmeina, jotka estimoivat ja vertailevat useita erilaisia malleja. Tulokulma empiiriseen tieteen tekemiseen on siten hieman erilainen kuin taloustieteen perinteisissä sovelluksissa, joissa tutkija tyypillisesti valitsee ja estimoi mallin jonkin teorian tai periaatteen perusteella. Uskoi koneoppivien mallien mullistaviin vaikutuksiin taloustieteen kehitykselle tai ei, uusien menetelmien hyödyt voi nähdä vähintäänkin inkrementaalisina – eli pienten lisäysten kautta tapahtuvina – kuten lyhyt katsauksemme koneoppiviin malleihin ja talouden ennustamiseen toivottavasti on osoittanut.

Kirjoittajat

Markku Lehmus
ennustepäällikkö
ETLA
markku.lehmus at etla.fi

Markku Lehmus on toiminut Etlassa tutkijana vuodesta 2015 lähtien. Ennustepäällikön tehtävään hän siirtyi vuonna 2018. Tätä ennen hän on työskennellyt mm. Palkansaajien tutkimuslaitoksessa, Turun yliopistossa ja VATT:ssa. Lehmus väitteli valtiotieteiden tohtoriksi Turun yliopistosta vuonna 2012. Nykyisessä tutkimustyössään hänen vastuualueitaan ovat makrotaloustiede, makromallit ja ennustaminen.

Aleksi Avela
tutkimusharjoittelija
ETLA
aleksi.avela at etla.fi

Aleksi Avela on tutkimusharjoittelija Elinkeinoelämän tutkimuslaitoksessa (ETLA) sekä diplomityöntekijä Aalto-yliopistossa matematiikan ja operaatiotutkimuksen pääaineessa. Hänen tutkimuskohteensa liittyvät koneoppimiseen ja erityisesti luonnollisen kielen käsittelyyn. Hän on ollut kehittämässä ETLA:n koneoppivaan malliin perustuvaa taloudellisen epävarmuuden indeksiä.

Jetro Anttonen
tutkija
ETLA
jetro.anttonen at etla.fi

Jetro Anttonen on väitöskirjatutkija Helsingin yliopistossa ja on toiminut Etlassa tutkimusharjoittelijana ja tutkijana vuodesta 2018. Hänen tutkimuksensa keskittyy pääasiassa taloustieteellisessä tutkimuksessa ja ennustekäytössä käytettävien tilastollisten menetelmien kehittämiseen.

Kirjallisuus

Abe, M. & Nakayama, H. (2018), Deep Learning for Forecasting Stock Returns in the Cross-Section. In In Pacific-Asia Conference on Knowledge Discovery and Data Mining, pp. 273–284.

Athey, S. (2017), Beyond prediction: Using big data for policy problems. Science, 03 Feb 2017. Vol. 355, Issue 6324, pp. 483–485.

Athey, S. (2019), 21. The Impact of Machine Learning on Economics. The Economics of Artificial Intelligence, edited by Ajay Agrawal, Joshua Gans and Avi Goldfarb, Chicago: University of Chicago Press, 2019, pp. 507–552.

Avela, A. & Lehmus, M. (2020), It’s in the news: Developing a real time index for economic uncertainty based on Finnish news titles. ETLA Working Papers, 84.

Bates, J. M. & Granger, C. W. J. (1969), The Combination of Forecasts. Journal of the Operational Research Society, 20(4), 451–468.

Coulombe, P. G. & Leroux, M. & Stevanovic, D. & Suprenant, S. (2020), How is Machine Learning Useful for Macroeconomic Forecasting. arXiv:2008.12477 (econ).

Nakamura, E. (2005), Inflation forecasting using a neural network. Economics Letters, 86(3):373–378.

Rennie, J. & Shih, L. & Teevan, J. & Karger, D. (2003), Tackling the poor assumptions of naive Bayes text classifiers. Proceedings of the 20th International Conference on Machine Learning, (ICML-2003):616–623.

Smelter, H. A. & Cook, T. R. A. (2017), Macroeconomic indicator forecasting with deep neural networks. Technical Report, Federal Reserve Bank of Kansas City.

Wallis, K. F. (2011), Combining Forecasts: Forty Years Later. Applied Financial Economics, 21(1–2), 33–41.