Osakeindeksien hajauttaminen, osa 3 – edistynyt korrelaatioanalyysi

13.01.2017

Osakeindeksien kolmannessa (ja viimeisessä osassa) mennään askelta syvemmälle analyyseihin. Samalla päädytään hieman haastavampiin ja teknisempiin ratkaisuihin, joten suosittelen laittamaan turvavyöt kiinni.

Lyhyesti aiemmista osista

Aiemmissa osakeindekseiden hajauttamiseen liittyvissä artikkeleissa tutkittiin S&P500, FTSE 100, IBEX 35,  FTSE MIB, DAX, CAC 40, NIKKEI, AORD -indeksejä. Huomattiin, että näiden osakeindeksien viimeisimmän n. 20 vuoden käyttäytyminen on ollut syklistä, johtuen esim. IT-kuplasta, jolla näytti olevan vaikutusta kaikkiin edellä mainittuihin indekseihin. Toinen suuri kasvu ja lasku tapahtui edellisen finanssikriisin aikaan, jolloin jälleen kaikki indeksit kokivat sukelluksen. Huomattiin myös, että tarkastelun kohteena olevat indeksit ovat sopeutuneet finanssikriisin jälkeiseen aikaan vaihtelevin menestyksin. Samaan aikaan kun osa, kuten yhdysvaltojen S&P500 ja saksan DAX, ovat lähteneet kiitettävään nousuun, ovat toiset, kuten MIB (Italia) ja IBEX 35 (Espanja), kärvistelleet.

Indeksit4

2000-luvun alun IT-kuplan, kuten myös vuonna 2007 alun saaneen finanssikriisin vaikutuksia nähtiin kaikissa tarkastelun kohteena olevissa indekseissä. Ne olivat siis globaaleja ilmiöitä ja vaikuttivat sijoituksiin kaikkialla.

Vai vaikuttivatko?

Miten niihin reagoivat Intian, Argentiinan tai vaikkapa Kiinan markkinat? Oliko näiden maiden osakeindekseissä samankaltaisia syöksyjä? Tutkitaan asiaa hieman tarkemmin.

Tilastollinen riippuvuuksien tarkastelu

Ennen kuin riippuvuuksia päästään tarkastelemaan on syytä tietää hieman mitä oikeastaan ollaan tarkastelemassa ja miten tulisi edetä.

Osakeindeksi ovat ajallisesti järjestyksessä oleva arvojoukko, eli se on aikasarja. Ominaista aikasarjalle on, että sen tarkasteltava arvo riippuu sen omasta historiasta. Tyypillisesti ajatellaan, että aikasarjalla voi olla trendi, kausivaihtelu tai muunlaista syklisyyttä. Trendillä tarkoitetaan pitkän tähtäimen muutosta keskiarvossa. Kausivaihtelusta tyypillisesti puhutaan kalenterivuoden sisäisestä vaihtelusta. Sykli sen sijaan voi olla jostain muusta johtuvaa ajallista heilahtelua.

Esimerkki aikasarjasta

Otetaanpas väliin kevyt esimerkki aikasarjasta.

lake

Yllä olevassa kuvassa on Huronjärjen pinnan korkeus vuosilta 1875-1972. Huronjärven pinnan korkeus on selkeästi laskenut pitkällä aikavälillä, eli sillä on ollut laskeva trendi. Pelkästään paljaalla silmällä tarkastellen järven pinnan korkeus näyttäisi sisältävän muutaman vuoden mittaista kausittaista tai syklistä vaihtelua. Näyttäisi myös siltä, että pinnan korkeuden vaihtelu kasvaa ajan myötä.

Jätetään Huronjärvi rauhaan ja palataan takaisin osakeindeksien pariin.

Aikasarjojen riippuvuuksien tarkastelu

Nyt tiedämme mitä olemme tarkastelemassa. Aikasarjoja. Ja tarkemmin sanoen niiden välisiä riippuvuuksia. Helppoa ja yksinkertaista? Ei suinkaan. Aikasarjojen välisen riippuvuuden problematiikkaa on jo puitu aiemmassa blogissa: http://www.louhia.fi/2015/11/10/kuinka-mitata-kahden-aikasarjan-valista-korrelaatiota-ja-kuinka-kayttaa-toista-aikasarjaa-toisen-ennustamisessa-hyvaksi/. En täysin toista samaa asiaa, mutta lyhyehkö kertaus siitä lienee paikallaan.

Tyypillisesti kahden muuttujan välistä lineaarista riippuvuutta voidaan mitata esim. Pearsonin korrelaatiokertoimella. Tietyin oletuksin korrelaatiokertoimen avulla nähtäisiin kuinka toisen muuttujan arvojen vaihdellessa käy toisen muuttujan arvoille. Mikäli toisen muuttujan arvojen kasvaessa toisen arvotkin kasvavat, on kyseessä näiden kahden välisestä positiivisesta korrelaatiosta. Kun kyse on ajassa muuttuvista ilmiöistä, kuten osakeindeksit, niin Pearsonin korrelaatiokertoimen käyttö EI tule kuulonkaan. Tämä johtuu siitä, että Pearsonin korrelaatiokertoimen tapauksessa oletuksena on, että tarkastelun kohteena olevien muuttujien odotusarvo ja varianssi pysyvät samoina. Näin ei useinkaan aikasarjojen tapauksessa ole.

Miten sitten tulisi menetellä, jos halutaan aikasarjojen riippuvuuksista numeroita pöydälle? Varoituksen sana, nyt käydään hieman teknisempää asiaa läpi. Niille, jotka saavat päänsärkyä tilastotieteestä, suosittelen skippaamaan seuraavan osion, mutta lukemaan lopun tulokset.

Vaihtoehto 1

Osakeindeksi -aikasarjojen riippuvuuden laskemiseksi voidaan aikasarjat dekomponoida, eli riisua sarja trendiin, kausivaihteluun ja jäännöksiin. Kun havaintosarjalta poistetaan trendi ja ja kausivaihtelu, niin ”toivon mukaan” jäljelle jää stationaarinen aikasarja. Stationaarisuus on avattu tarkemmin aiemmin mainitussa blogissa. Stationaaristen sarjojen välistä riippuvuutta voidaan visualisoida pisteparvikuvion avulla ja niistä voidaan laskea Pearsonin korrelaatio. Huom. jos aikasarja on stationaarinen niin Pearsonin -korrelaatiokertoimen oletukset pätevät ja tulokset ovat järkeviä. Alla on kuva stationaarisesta aikasarjasta.

stationary

Mikäli dekomponoinnin antamat jäännökset eivät ole stationaarisia, täytyy asiaa miettiä uudelleen. Yksi vaihtoehto olisi dekomponoida jäännöksen ja käyttää sen sarjan jäännöksiä riippuvuuksien selvittämiseen. Tämä menettely on siitä huono, että jäljelle jäävän sarjan tulkinnallisuus on hankala.

Vaihtoehto 2

Toisena vaihtoehtona on sovittaa kullekin aikasarjalle ARIMA -malli ja laskea mallin jäännöksillä korrelaatiot. Tähän päädyttiin tällä kertaa. Tämä malli pitää tässä tapauksessa sisällään myös kausivaihtelukompontin, jolloin pitäisi todellisuudessa puhua SARIMA -mallista. Puhutaan tästä kokonaisuudesta yksinkertaisemmin ARIMA -mallina. Suurimpana syynä on se, että saadut jäännökset olivat stationaarisia, mikä sallii korrelaatioiden laskemisen. Toisena hyvänä syynä on, että ARIMA -mallin sovittaminen on helppoa R-ohjelmistossa. ARIMA -mallit ovat myös suosittuja aikasarjojen ennustamiseen käytettäviä tilastollisia menetelmiä.

Ai mikä ARIMA?

Lyhyesti sanottuna ARIMA on aikasarjan mallinnukseen käytettävä menetelmä. ARIMA kirjaimet  tulevat sanoista Auto Regressive Integrated Moving Average. Hieman tiivistetysti sanottuna AR -osio viestii siitä, että tutkittava aikasarja riippuu aiemmista havainnoista. MA sanelee, että tämänhetkinen arvo riippuu lineaarisesti aiemmista virhetermeistä. I puolestaan viittaa siihen, että alkuperäisen aikasarjan havainnot on korvattu peräkkäisten havaintojen erotuksilla. Erotukset tehdään, jotta aikasarja on lähempänä stationaarista. Kokonaisuutena ideana sovittaa malli mahdollisimman sujuvasti dataan.

Päästäänkö ARIMA -mallin jäännöksillä aina stationaariisiin sarjoihin? Valitettavasti ei aina. Näin käy helposti, jos tutkittavan aikasarjan vaihtelu muuttuu ajan saatossa paljon.

Esimerkiksi uuden pienen pörssiyhtiön osakkeiden arvo on tyypillisesti alkuun matala ja pysyy maltillisena mahdollisesti vuosia. Yhtiön osakkeiden arvo voi kuitenkin ponnahtaa esim. hyvän tuotteen avulla jyrkkään kasvuun ja heilahdella suuremmin kuin se pystyi pienellä osakkeen arvolla. Tällöin vaikka yhtiön osakkeen arvon aikasarjaan sovitetaan ARIMA -malli ja tutkitaan jäännöksiä, voivat ne osoittautua epästationaarisiksi.

Huh, siinäpäs oli paljon sisäistettävää. Nyt viimein päästäänkin itse asiaan, eli osakeindeksien riippuvuuksien tarkasteluun.

Tulokset

Artikkelisarjan ensimmäisessä osassa huomattiin, että S&P500 -indeksi oli suurimpien kasvajien joukossa finanssikriisin jälkeisinä vuosina. Muita S&P500 kanssa saman tasoisesti pärjänneitä olivat Saksan DAX ja Australian AORD. Tarkastellaan seuraavaksi Aasian ja Amerikan suuria indeksejä ja tutkitaan millaista muutosta valittujen maiden indekseissä on ollut viime vuosina.

Tarkastelun kohteeksi valitut osakeindeksit ovat BSE (Intia), SSE (Kiina), HSI (Hong Kong), TWII (Taiwan), MERVAL (Argentiina), MXX (Meksiko) ja vertailun vuoksi aiemmista artikkeleista tuttu S&P500 (Yhdysvallat). Näihin indekseihin päädyttiin, koska niistä kaikista oli saatavilla data jo vuoden 1998 alusta asti, eli ennen IT-kuplaa. Tarkasteltava aikaväli on tammikuusta 1988 heinäkuuhun 2016.

Osakeindeksit

Kuvasta nähdään, että porukasta erottuu varsin selkeästi MERVAL (ARG), jonka arvot katoavat kuvasta 2014 loppupuolella. Mikäli MERVAL-indeksin yrityksiin olisi sijoittanut 1998 alussa, olisi sijoituksensa yli 25-kertaistanut kesään 2016 mennessä! Sen suurta kasvua selittänee ainakin se, että MERVAL-indeksi koostuu vain 12 yrityksestä, minkä vuoksi se on herkempi muutoksille kuin esim. 500 yrityksestä muodostuva S&P 500. MERVAL-indeksin menestystä olisi kiinnostavaa tutkia, mutta tässä artikkelissa emme siihen perehdy tarkemmin.

Muita hyvin menestyneitä indeksejä 90-luvun lopussa sijoittaneille ovat olleet Intian BSE ja Meksikon MXX. BSE -indeksin yrityksiin sijoittanut olisi lähes 9-kertaistanut pääomansa ja MXX-indeksiin sijoittanut yli 10-kertaistanut sen. Sen sijaan Kiinan SSE, Hong Kongin HSI ja S&P 500 ovat vain yli tuplanneet arvonsa.

Huomionarvoista on myös, että finanssikriisin aikaan kukin tarkasteltavista osakeindekseistä syöksyi vauhdilla. Finanssikriisi näyttääkin aiheuttaneen hallaa sijoittajille, huolimatta missä heidän sijoituksensa olivat. Alla oleva taulukko kuvaa finanssikriisin aiheuttaman syöksyn suuruutta. Siinä on lueteltu prosentuaaliset pudotukset osakeindeksittäin vuoden 2007 maksimista vuoden 2009 minimiin. Huomataan, että osakeindeksien syöksyjen suuruudessa oli suuria eroja. Kiinan SSE syöksyi peräti 66,6%, kun Meksikon MXX ”selvisi vain” 43,6% pudotuksella.

Syoksyt

 

Osakeindeksien korrelaatiot

Artikkelisarjamme keskeinen ajatus oli osakkeiden kansainvälinen hajauttaminen, jotta suojelisimme salkkuamme mahdollisimman tehokkaasti suuren kansainvälisen pörssiromahduksen sattuessa. Kysymys kuuluukin, että mitkä osakeindeksit ovat historian valossa korreloineet heikosti keskenään? Tarkastellaan siis seuraavaksi kuinka vahvasti uudet tulokkaamme ovat heilahdelleet S&P500 kanssa ja keskenään. Kullekin osakeindeksi -aikasarjalle on sovitettu ARIMA -malli, seuraavaksi tutkitaan näiden mallien jäännösten välisiä korrelaatioita. Korrelaatiot on lueteltu alla olevaan taulukkoon.

Correlation

Korrelaatiomatriisista nähdään, että S&P500 -osakeindeksillä on suurin korrelaatio MERVAL -indeksin (ARG) kanssa, mutta sen suuruus on vain 0,11. Huomataankin, että S&P500 korreloi varsin vähän valittujen indeksien kanssa. Muita heikosti keskenään korreloivia osakeindeksejä olivat ainakin MERVAL ja BSE (0,10), MERVAL ja SSE (0,13) ja MERVAL ja TWI (0,18). Hieman ehkä yllätyksenä on naapurimaiden Meksikon MXX:n ja Yhdysvaltojen S&P500 välinen lähes nollan korrelaatio.

Johtopäätökset ja huomiot

Saamamme tulokset näyttäisivät ehdottavan S&P500 -osakeindeksien yrityksiin sijoittaneelle lisäsijoituskohteiksi esimerkiksi MERVAL (Argentiina) ja BSE (Intia) -indeksien yrityksiä. Näin tekemällä olisivat riskit hajautettu paremmin kuin jos sijoittaa S&P500 -osakeindeksin yrityksien lisäksi Saksan DAXn ja Aussien AORD kaltaisien osakeindeksien yhtiöihin. Niillä, kuten artikkelisarjamme ensimmäisestä osasta voi muistella, kulkusuunta oli hyvin samanlainen.

Asia ei välttämättä kuitenkaan ole näin yksinkertainen, sillä S&P500/DAX/AORD -salkun vaihtelu on pienempää kuin S&P/MERVAL/BSE -salkulla. Ensin mainittu salkku olisi tässä mielessä sijoittajalle turvallisempi vaihtoehto. Toisaalta kolikolla on kääntöpuolensa. Jos kaipaa suurempaa tuottoa suuremmalla riskillä, voisi MERVAL ja BSE olla käypiä vaihtoehtoja S&P500 -indeksin lisäksi. Jotta jälkimmäistä vaihtoehtoa kannattaisi edes harkita tulisi ensin tarkastella esim. Argentiinan ja Intian indeksien kasvun ja inflaation välistä suhdetta tutkia. Voihan olla, että indeksit kasvavat hurjaa vauhtia, mutta samaan aikaan rahan arvo heikkenee, jolloin todellista tuottoa ei kerrykään.

On kuitenkin tärkeää huomioida, että edellisen finanssikriisin aikaan kaikki tarkasteltavat osakeindeksit sukelsivat. Joten mikään osakeindeksien yhdistelmä ei ole suojassa sen kaltaisilta suurilta katastrofeilta.

Huomiona vielä käytetystä korrelaation laskemistavasta, että aikasarjojen alkupään samankaltaisuus (kaikkien arvot melko pieniä skaalauksen vuoksi) voi vaikuttaa korrelaation vahvasti ja vääristää tuloksia. Jälkikäteen mietittynä parempi lähestymistapa olisi voinut olla laskea korrelaatio jonkinlaisella liukuvalla ikkunamenetelmällä (moving window).

Kirjoittaja: Olli Leppänen, Louhia DataLab

Lähteet: https://uk.finance.yahoo.comhttps://in.finance.yahoo.com/

Käytetyt ohjelmistot: R, Excel

Louhian DataLab-palvelu

Yhteydenotto

Mikäli olet kiinnostunut yrityskohtaisista palveluista tai sinulla kysyttävää palvelujemme sisällöstä, niin ota yhteyttä oheisella lomakkeella tai soita Mikalle numeroon 040 845 8432.

Please leave this field empty.