Kombinatorinen räjähdys
Todellisessa päätöstilanteessa on tyypillisesti monia tekijöitä, jotka
vaikuttavat vaihtelevasti. Joskus yksi asia on olennaisin vaikuttaja, joskus
toinen, joskus monet yhdessä. Kombinatorinen räjähdys on termi, joka muistuttaa
siitä, että seurattavien tekijöiden lukumäärän kasvaessa lineaarisesti niiden
mahdollisten arvokombinaatioiden lukumäärä kasvaa eksponentiaalisesti.
Jos esimerkiksi on otettava huomioon samanaikaisesti 20 muuttujaa,
joilla on viisi mahdollista arvoa kullakin, saadaan jo 5 potenssiin 20 eli
95.367.431.640.625 erilaista tapausvaihtoehtoa. Tällaisia "tähtitieteellisiä"
lukumääriä eri mahdollisuuksia ei tietenkään voida käsitellä kutakin erikseen.
BayMiner tarjoaa tavan hahmottaa kombinatorisen räjähdyksen taakse
kätkeytyvää todellisuutta. Teoreettinen ja laitteistotekninen edistys
mahdollistaa datarivien todennäköisyyspohjaisen luokittelun kaikkien
muuttujanarvojen perusteella. Näin aineistolle löytyy luonnollinen
klusterointi (ryvästys eli aliaineistojako), jossa erityyppiset tapaukset
erottuvat toisistaan ja data-aineiston sisältämä olennainen informaatio
saadaan esille.
Tämä on aivan eri asia kuin mahdollisuus nähdä yksittäisten muuttujien
jakaumia ja keskilukuja tai muuttujaparien välisiä korrelaatiokertoimia
tai regressiosuoria. BayMiner näyttää aineiston jakautuneena aliaineistoihin,
joista kukin kuvaa tietyntyyppistä tilannetta (jossa keskeisiä ovat esim.
jotkut tietyt tekijät yhdessä tai joku yksinäänkin). Koko aineiston voi nyt
hahmottaa visuaalisesti yhdellä silmäyksellä. Klusterikohtainen tutkiminen
selvittää kunkin aliaineiston osalta olennaiset tekijät.
BayMinerin lisäetuja ovat mahdollisuus valikoida analysoitavat muuttujat,
puutteellisenkin datan käyttökelpoisuus syöteaineistona ja otantaoptio,
joka mahdollistaa suuren data-aineiston analysoinnin kohtuuajassa sen
satunnaisesti valittua osajoukkoa käyttämällä (tätä menettelyä toistamalla
saa heti kuvan löytyneiden klustereiden yleistyvyydestä eli
otosriippumattomuudesta).