Data Mining vs OLAP
Izvajanje podatkov in OLAP sta dve skupni tehnologiji poslovne inteligence (BI). Poslovna inteligenca se nanaša na računalniško zasnovane metode za prepoznavanje in črpanje koristnih informacij iz poslovnih podatkov. Rudarjenje podatkov je področje računalništva, ki se ukvarja z pridobivanjem zanimivih vzorcev iz velikih nizov podatkov. Združuje številne metode iz umetne inteligence, statistike in upravljanja z bazami podatkov. OLAP (spletna analitična obdelava), kot že ime pove, je zbirka načinov za iskanje večdimenzionalnih baz podatkov.
Rudarjenje podatkov je znano tudi kot odkritje znanja v podatkih (KDD). Kot že omenjeno, gre za področje računalništva, ki se ukvarja z črpanjem prej neznanih in zanimivih informacij iz surovih podatkov. Zaradi eksponentne rasti podatkov, zlasti na področjih, kot je poslovanje, je pridobivanje podatkov postalo zelo pomembno orodje za pretvorbo tega velikega bogastva podatkov v poslovno inteligenco, saj je ročno črpanje vzorcev v zadnjih desetletjih na videz nemogoče. Na primer, trenutno se uporablja za različne aplikacije, kot so analiza družbenih omrežij, odkrivanje goljufij in trženje. Izvajanje podatkov se običajno ukvarja z naslednjimi štirimi nalogami: grozdenje, razvrščanje, regresija in povezovanje. Grozdanje je identifikacija podobnih skupin iz nestrukturiranih podatkov. Razvrstitev so pravila učenja, ki jih je mogoče uporabiti za nove podatke in bodo običajno vključevala naslednje korake: predhodna obdelava podatkov, oblikovanje modeliranja, izbira učenja / lastnosti in vrednotenje / potrjevanje. Regresija je iskanje funkcij z minimalno napako za modeliranje podatkov. In zveza išče odnose med spremenljivkami. Podatkovno rudarjenje se običajno uporablja za odgovor na vprašanja, na primer, kateri so glavni proizvodi, ki bi lahko v Wal-Martu prihodnje leto pripomogli k visokemu dobičku.
OLAP je razred sistemov, ki nudijo odgovore na večdimenzionalne poizvedbe. OLAP se običajno uporablja za trženje, oblikovanje proračuna, napovedovanje in podobne aplikacije. Samoumevno je, da so baze podatkov, ki se uporabljajo za OLAP, konfigurirane za zapletene in ad-hoc poizvedbe s hitro izvedbo. Običajno se za prikaz izhoda OLAP uporablja matrica. Vrstice in stolpci so oblikovani po dimenzijah poizvedbe. Za pridobitev povzetkov pogosto uporabljajo metode združevanja na več tabelah. Na primer, ali je mogoče izvedeti o letošnji prodaji Wal-Mart-a v primerjavi z lanskim letom? Kakšna je napoved prodaje v naslednjem četrtletju? Kaj lahko rečemo o trendu, če pogledamo odstotek spremembe?
Čeprav je očitno, da sta Data mining in OLAP podobna, ker delujeta na podatkih za pridobivanje inteligence, glavna razlika pa je v tem, kako delujejo na podatkih. OLAP orodja omogočajo večdimenzionalno analizo podatkov in povzemajo podatke, toda nasprotno, rudarjenje podatkov se osredotoča na razmerja, vzorce in vplive v naboru podatkov. To je dogovor OLAP o združevanju, ki se omeji na delovanje podatkov z "dodajanjem", vendar pa rudarjenje podatkov ustreza "delitvi". Druga pomembna razlika je, da medtem ko orodja za rudarjenje podatkov modelirajo podatke in vračajo dejanska pravila, bo OLAP v realnem času izvajal primerjalne in kontrastne tehnike po poslovni dimenziji..