Tarinat kulissien takaa

Asiantuntijamme avautuvat

Kirjoittajalta Lasse Liukkonen

Yksinkertainen brändilojaalisuus analyysi Markovin ketjujen avulla

Blogin tarkoituksena on käydä läpi yksinkertainen lähestymistapa brändilojaalisuuden tutkimiseen, vaikkakin taustalla lymyävä Markovin ketjujen teoria ei ole välttämättä yksinkertaista (ainakaan tilanteissa, joissa ketjujen siirtymäydin on jatkuva vrt. siirtymämatriisi). Konstruoimme esimerkkiaineiston avulla Markovin ketjun siirtymämatriisin, jonka avulla saamme laskettua lojaalisuutta kuvaavat kertoimet (tasapainojakauman todennäköisyydet). Aluksi käymme kuitenkin aineiston kimppuun. 1. Aineisto Esimerkkiaineistona on tarkasteltu 39 asiakkaan…

Hintajoustoanalyysi monimuuttujaisen regressiomallin avulla

Hintajoustoanalyysi on helpoimmillaan regressioanalyysiä ja regressiomallin oikeanlaista tulkintaa. Artikkelissa (http://www.dataapple.net/?author=1) käsitellään aihetta selkeästi ja melko yksityiskohtaisesti. Tässä blogissa esitellään edellä mainitun artikkelin pääkohdat eli hintajoustoanalyysin päävaiheet, tulokset ja tulkinnat R-ohjelmoinnin sovelluksena. Käytämme tässä generoitua aineistoa, jonka struktuuri on sama kuin artikkelissa. Hintajoustoanalyysillä haetaan vastauksia muun muassa seuraaviin kysymyksiin: Mitkä tarkasteltavat tuotteet ovat toistensa substituutteja/komplementteja​? Mikä on…

Aikasarja-analyysin alkuaskeleet: Aikasarjan dekomponointi (”AD HOC” ja LOESS)

Aikasarjat Aikasarjat monelle lienee tuttu käsite, aikasarjoja esiintyy viikottain esimerkiksi useissa lehdissä, webbisivuilla ja talousuutisissa. Jos kuitenkin aikasarjat eivät ole sinulle tuttuja voidaan lyhyesti sanoa, että aikasarja on jonkin ilmiön (esim. pörssikurssi) ilmenemistä ajan suhteen mitattuna. Itse aikasarja-analyysi on tilastotieteen osa-alue, jossa pääpainona on usein miten löytää tarkastelevan sarjan generoima yleisempi (stokastinen) prosessi, jonka teoreettisia…

Ristiinvalidoinnista

Mitä on ristiinvalidointi ja miksi sitä käytetään lähes aina mallinnusongelmissa? Ristiinvalidointi on laajalti käytössä oleva tilastotieteen menetelmä tai pikemminkin menettelytapa, jonka oleelliset tarkoitukset ovat mallinvalintatilanteessa arvioida mallien tuottamaa (odotusarvoista) ennustevirhettä, sekä auttaa hyperparametrien optimoinnissa vastaavalla tavalla. Tilanteet, joissa meillä on riittävän suuri määrä havaintoja (suhteessa muuttujien määrään) ristiinvalidoinnin tai vastaavien menettelyjen käyttäminen ei välttämättä ole…

Analytiikan huippumenetelmiä tiivistettynä, osa: Satunnainen metsä (Random Forest)

Oletko kuullut jossain yhteydessä menetelmästä satunnainen metsä (eng. Random Forest)? Jos olet ollut tekemisissä allekirjoittaneen kanssa, et ole voinut välttyä termin kuulemisesta edes kahvipöydässä tai marketin kassajonossa. Mikäli olet kyennyt välttymään termin kuulemiselta, nyt on viimeistään aika ottaa selvää mitä ihmettä tuo ’Satumetsä’ tarkoittaa, mitä sillä tehdään ja miksi siitä on täytynyt puhua kassajonossakin. Nykyisin…

Kun muuttujia on liikaa, havaintoja liian vähän ja haluaisit käyttää lineaarista regressiota

Yhä useammalla tilastotieteen sovellusalalla törmää tilanteeseen, jossa havaintojen määrä on pieni verrattuna muuttujien määrään. Tälläisen tilanteen vastaan tullessa esim. lineaarisen regression sovittaminen ei teoreettisesti ole mahdollista/järkevää (vaikka muuttujat eivät olisikaan korreloituneita) ilman riittävää työkalupakkia. Tilastotieteilijän pakista tulisi löytyä ainakin askeltavat muuttujien valitsijat (ahneet algoritmit), paras muuttujien osajoukko-algoritmi, sekä ennen kaikkea ridge/lasso-regressiomenetelmän soveltamistyökalut. En ole kuullut…

Yhteydenotto

Mikäli olet kiinnostunut yrityskohtaisista palveluista tai sinulla kysyttävää palvelujemme sisällöstä, niin ota yhteyttä oheisella lomakkeella tai soita Mikalle numeroon 040 845 8432.