Jakaumien tulkinta

Tummat kapeat vihreät pylväät kuvaavat siis koko joukon jakaumaa, vaaleanvihreät vain valitun joukon jakaumaa ja punaiset alaspäin suuntautuvat pylväät näiden erotusta.

Jakaumien tulkinnan perusperiaate on yksinkertainen. Etsitään niitä muuttujia, joilla on suhteellisen suuri punainen pylväs. Tästä tiedetään heti, että ne ovat merkittäviä selittäviä tekijöitä.

Jos muuttujia on paljon, ne paljastuvat parhaiten vetämällä oikeassa laidassa olevaa "hissiä" hitaasti alaspäin ja/tai edestakaisin.Avataan eri ikkunaan niiden muuttujien jakaumat, jotka kiinnittävät huomiota (klikkaus kuvan päälle), ja tarkastetaan niitä syvällisemmin.

  • Ne muuttujat, joilla on paljon punaista, kuvaavat parhaiten valitun pistejoukon ominaisuuksia.
  • Tyhjät solut aiheuttavat oman pylvään, joka yleensä sijoittuu oikeaan laitaan
  • Leveyden määräytyminen on monimutkainen prosessi, lisätietoja osiossa "asiantuntijoille"
Kuva Yleistä Lisätietoja
Tyypillinen klusteriprofiili. Lähes kaikissa muuttujissa on selvä punainen pylväs viivan alapuolella. Kaikki nämä muuttujat kuvaavat valitun klusterin ominaisuuksia melko voimakkaasti, koska punaiset pylväät ovat melko suuria. Valittuna ovat kalliinpuoleiset autot.
Esimerkki valitun joukon (klusterin) profiilista. Ne muuttujat, joiden kohdalla keskiviivan alapuolella on suuri punainen pylväs, kuvaavat valittua joukkoa voimakkaimmin. Vihreät pylväät päädyissä ovat joko puuttuvia tai ei numeeriisia arvoja, esim. '>3', jonka BayMiner siis tunnistaa merkkeinä eikä numerona! Pylväiden leveysvaihtelut johtuvat järjestelmän suorittamasta optimoinnista.
Esimerkki yhden muuttujan jakaumasta. Kapeat tummat pylväät kuvaavat koko joukon jakaumaa, vaaleansiniset valitun joukon jakaumaa ja punaiset alaspäin suunnatut pylväät eroa näiden kahden välillä.  
Jakaumakuva moottorin kierrosluvusta. Tämä on esimerkki ilmiöstä, jonka taustaa on tunnettava, jotta saa kaiken hyödyn irti.  
Jakaumakuva asiakasiän mukaan. Kyseessä on nuoria aikuisia, koko joukon painottuessa selvästi vielä nuorempiin, (tummat pylväät). Otannan pienuudesta johtuen aineiston jaottelu ei ole kovin tasainen. Vaihtoehtoisesti näiden asiakkaiden erottautuminen omaksi ryhmäkseen voi johtua tunnistamattomista asiasyistä, joita voi ehkä löytää värittämällä kuva eri muuttujilla. Esim. ravintola-asiakkaat, jotka vain tilaavat lounaan, pelkän kahvin tms. Vielä yksi vaihtoehto on, että valinta ei ole ollut "puhdas" eli joukossa on muihin klustereihin kuuluvia asiakkaita.
Jaukama kuvaa asiakkaan asuinetäisyyttä metroasemasta. Etäisyys on annettu kilometreissä ja muuttuja on nominalisoitu ennen mallin laskentaa, jollon km arvot ovat mukana sellaisenaan (vihreinä pylväinä, ei sinisinä, kuten jatkuvat muuttujat).  
Esimerkki jakaumasta, kun muuttujan arvot puuttuvat suurimmasta osasta tapauksia. Kaikki auton valmistajat eivät vielä ilmoita partikkelipäästöjä.

Esimerkki siitä, miten voi tunnistaa yksittäisen tapauksen, tässä automerkin, valitusta klusterista. Kyseessä on mukavuusindeksi/hinta, josta karkeasti voi vetää johtopäätöksiä siitä, mitkä merkit antavat parhaan mukavuusarvon suhteessa auton hintaan. Tämän datan on esittelykäyttöön luovuttanut Tuulilasi-lehti.


 
Copyright © Bayes Information Technology Oy 2001. All rights reserved. See Legal Notice.
Kommentteja tai palautetta?