| |
Jakaumien tulkinta
Tummat kapeat vihreät pylväät kuvaavat siis koko joukon jakaumaa,
vaaleanvihreät vain valitun joukon jakaumaa ja punaiset alaspäin
suuntautuvat pylväät näiden erotusta.
Jakaumien tulkinnan perusperiaate on yksinkertainen.
Etsitään niitä muuttujia, joilla on suhteellisen suuri punainen pylväs.
Tästä tiedetään heti, että ne ovat merkittäviä
selittäviä tekijöitä.
Jos muuttujia on paljon, ne paljastuvat parhaiten
vetämällä oikeassa laidassa olevaa "hissiä" hitaasti
alaspäin ja/tai
edestakaisin.Avataan eri ikkunaan niiden muuttujien jakaumat, jotka
kiinnittävät huomiota (klikkaus kuvan päälle), ja tarkastetaan
niitä syvällisemmin.
-
Ne muuttujat, joilla on paljon punaista, kuvaavat
parhaiten valitun pistejoukon ominaisuuksia.
-
Tyhjät solut aiheuttavat oman pylvään, joka yleensä
sijoittuu oikeaan laitaan
-
Leveyden määräytyminen on monimutkainen prosessi,
lisätietoja osiossa "asiantuntijoille"
| Kuva |
Yleistä |
Lisätietoja |
|
Tyypillinen klusteriprofiili.
Lähes kaikissa muuttujissa on selvä punainen pylväs viivan alapuolella.
Kaikki nämä muuttujat kuvaavat valitun klusterin
ominaisuuksia melko voimakkaasti,
koska punaiset pylväät ovat melko suuria.
|
Valittuna ovat kalliinpuoleiset autot. |
|
Esimerkki valitun joukon (klusterin) profiilista. Ne muuttujat,
joiden kohdalla
keskiviivan alapuolella on suuri punainen pylväs,
kuvaavat valittua joukkoa voimakkaimmin.
Vihreät pylväät päädyissä ovat joko puuttuvia tai
ei numeeriisia arvoja, esim. '>3', jonka BayMiner siis
tunnistaa merkkeinä eikä numerona!
|
Pylväiden leveysvaihtelut johtuvat järjestelmän
suorittamasta optimoinnista.
|
|
Esimerkki yhden muuttujan jakaumasta. Kapeat tummat pylväät
kuvaavat koko joukon jakaumaa, vaaleansiniset
valitun joukon jakaumaa ja
punaiset alaspäin suunnatut pylväät eroa näiden kahden välillä.
|
|
|
Jakaumakuva moottorin kierrosluvusta. Tämä on esimerkki ilmiöstä,
jonka taustaa on tunnettava, jotta saa kaiken hyödyn irti.
|
|
|
Jakaumakuva asiakasiän mukaan. Kyseessä on nuoria
aikuisia, koko joukon painottuessa selvästi vielä nuorempiin,
(tummat pylväät).
Otannan pienuudesta johtuen aineiston jaottelu ei ole kovin tasainen.
|
Vaihtoehtoisesti näiden asiakkaiden erottautuminen omaksi
ryhmäkseen voi johtua tunnistamattomista asiasyistä, joita
voi ehkä löytää värittämällä
kuva eri muuttujilla. Esim. ravintola-asiakkaat, jotka vain tilaavat
lounaan, pelkän kahvin tms.
Vielä yksi vaihtoehto on, että valinta ei ole ollut
"puhdas" eli joukossa on muihin klustereihin kuuluvia
asiakkaita.
|
|
Jaukama kuvaa asiakkaan asuinetäisyyttä metroasemasta.
Etäisyys on annettu kilometreissä ja muuttuja on nominalisoitu ennen
mallin laskentaa, jollon km arvot ovat mukana sellaisenaan (vihreinä
pylväinä, ei sinisinä, kuten jatkuvat muuttujat).
|
|
|
Esimerkki jakaumasta, kun muuttujan arvot puuttuvat
suurimmasta osasta tapauksia.
|
Kaikki auton valmistajat eivät vielä ilmoita
partikkelipäästöjä.
|

Esimerkki siitä, miten voi tunnistaa yksittäisen tapauksen, tässä
automerkin, valitusta klusterista. Kyseessä on mukavuusindeksi/hinta, josta
karkeasti voi vetää johtopäätöksiä siitä, mitkä merkit antavat parhaan
mukavuusarvon suhteessa auton hintaan.
Tämän datan on esittelykäyttöön luovuttanut Tuulilasi-lehti.
|
|