Analyysiin liittyviä kysymyksiä
Takaisin usein kysyttyihin kysymyksiin
Miksi mallinnus kestää niin pitkään?
Bayes Information Technology Oy:n käyttämät Bayes-verkot eivät
ole ns.
standardi Bayes-verkkoja, vaan ne ovat monimutkaisempia ja
vastaavasti myös niiden suorituskyky on parempi. Niiden laskentaan
tarvitaan
enemmän kapasiteettia kuin perinteellisten Bayes-verkkojen laskennassa.
Lisäksi BayesIT:n patentoima B-Vis-visualisointiteknologia
on ainutlaatuinen tapa saada monimutkaisten
riippuvuuksien kokonaisuus visualisoitua hyvin, mutta se vaatii
paljon laskentakapasiteettia.
Usein kuvien laskenta onkin suurempi tehtävä kuin verkon laskenta.

Miksi laskenta-ajan ennustekäyrä heittää jatkuvasti?
Mallin laskennan eteneminen riippuu monesta tekijästä. Koon lisäksi
merkityksellisimpiä ovat mm. muuttujien arvojen samanlaisuus.
Jos syntyy suuria "ryppäitä" niiden purkaminen voi viedä
pitkän ajan. Siksi ei ole mahdollista ennustaa laskennan kestoa tarkasti.

Miksi kuvat joskus vaikuttavat erilaisilta, vaikka data on lähes samaa?
BayMiner laskee mallin niin suuresta muuttujamäärästä, että
niiden teoreettinen kombinaatiolukumäärä ylittää käytännön
laskentamahdollisuudet (mikään tietokone ei siihen järjellisessä ajassa
pysty). Tämä tarkoittaa mm. sitä, että tulokseen
vaikuttaa satunnaistekijät. Tässä tilanteessa se voi johtaa siihen, että
perättäiset ajot ovat varsinkin visuaalisesti jonkin verran erilaiset.
Kun tulos muutetaan kuvaksi "avaruuskulma" voi myös
em. syystä olla eri, joten ensi vaikutelmana voi
näyttää siltä, että 3-D esitykset ovat erilaisia.
Tämä pätee erityisesti, jos dataa on vähän, datassa
ei ole riitävästi informaatiota tai ongelma on muuten
hyvin vaikea mallintaa.
Ylipäänsä on syytä muistaa, että kuvien
pääasiallinen tehtävä on auttaa tunnistamaan mielenkiintoisia ilmiöitä,
joita sitten voi tutkia tarkemmin.

Kuinka montaa muuttujaa ja niiden eri arvoa Bayminer pystyy käsittelemään tehokkaasti?
Satoja ja tietyin edellytyksin tuhansia muuttujia, ja kymmeniä arvoja
per muuttuja. Yli 55 nominaaliarvon muuttujat sivuutetaan
automaattisesti.

Mitä teen, kun haluan muuttaa valmista mallia?
Yleisin tarve lienee muuttujien lisääminen. Kokeilun jälkeen vasta
ymmärretään paremmin ne mahdollisuudet, joita BayMiner tarjoaa.
Uudet muuttujat lisätään alkuperäiseen taulukkoon (tai tietokantaan) ja
pyritään hankkimaan jo käytössä oleville esimerkkitapauksille arvo myös
uusille muuttujille, jonka jälkeen suoritaan uusi mallinnus. Jos uusille
muuttujille ei löydy arvoja ne voi jättää pois, mutta jos tällaisia
tapauksia on paljon mallin laatu heikkenee.
Vastaavasti jos
esimerkkejä tulee lisää ne lisätään taulukkoon/tietokantaan ja uusitaan
mallinnus. Poistaminen käy samoi, taulukosta poistetaan ko. kohdat ja
lasketaan uusi malli. Kokeilumielessä poistamisen voi tehdä myös
väliaikaisesti datan tarkstusvaiheessa ohittamalla ko muuttuja.
Bayes-verkon laskennassa muuttujien ja esimerkkien paikalla ei ole muuta
merkitystä kuin että esimmäisen sarakkeen muuttuja määrää aloituskuvan
(yleisen) värin. Siksi kannatta sijoittaa ensimmäiseen sarakkeeseen joku
mielenkiintoinen muuttuja ja viimeisiksi sellaiset joissa ei ole
informaatiota (nimet, osoiteet, järjestysnumerot)

Kun vaihtaa mallia ja on edellisen kohdalla tehnyt valinnan, niin
miten valinnalle käy uuden kohdalla?
Kyseessä on edelleen sama pistejoukko, eli samat rivit datasta. Eri
visualisoinnissa pisteiden sijainti toki muuttuu. Tämä on ihan
tarkoituksella, voi katsoa, että miten joku ryväs sijoittuu toisessa
visualisoinnissa.

Takaisin usein kysyttyihin kysymyksiin
|