Data Mining vs Skladiščenje podatkov
Proces rudarjenja podatkov se nanaša na vejo računalništva, ki se ukvarja z črpanjem vzorcev iz velikih nizov podatkov. Te sklope nato kombiniramo s pomočjo statističnih metod in umetne inteligence. Rudarjenje podatkov v sodobnem poslovanju je odgovorno za pretvorbo surovih podatkov v vire umetne inteligence. Podatki se manipulirajo in so tako sposobni dati zanesljive odločitve, ki jih je mogoče uporabiti pri odločanju. To daje podjetjem prednost pred konkurenco, saj imajo nabore podatkov, na katere se lahko zanesejo za obveščevalne podatke. Podatkovno rudarjenje uporabljajo tudi organizacije pri praksah profiliranja, vključno s trženjem, nadzornim znanstvenim odkrivanjem in odkrivanjem prevar.
Obstajajo tudi drugi pogosti izrazi, ki so lahko povezani z iskanjem podatkov, na primer ribolov podatkov, odkopavanje podatkov ali celo beljenje podatkov. Vse to kaže na različne variacije podatkovnega rudarjenja, ki se uporabljajo pri vzorčenju majhnih nizov podatkov, ki so morda premajhni za izdelavo statističnih sklepov. Ti pa so ključnega pomena za določitev veljavnosti podatkov, ki se uporabljajo, in jih je mogoče uporabiti pri ustvarjanju hipoteze, če želimo doseči določeno populacijo podatkov.
Na drugi strani je podatkovno skladišče izraz, ki opisuje sistem v organizaciji, ki se uporablja pri zbiranju podatkov. Ti podatki, ki jih zbira podatkovno skladišče, so tisti, ki jih ponujajo transakcijski sistemi, kot so računi, evidence o nakupih ali celo evidenca posojil. Zapisi podatkov so vzeti s posameznih točk ustvarjanja in so združeni pod eno streho, ki je zbirka podatkov. Ti podatki se nato poročajo, poročanje pa se opravi na strnjen način, da se uporabnikom poslovnih informacij pomaga pri sprejemanju veljavnih odločitev. Za učinkovito delovanje skladišča podatkov so potrebni vir podatkov, zbirka podatkov in orodje za poročanje.
Zato lahko rečemo, da je podatkovno skladišče baza podatkov, ki se uporablja za posebne namene poročanja o analiziranih podatkih. Ti podatki prihajajo iz različnih sistemov, ki so bili pripravljeni za poročanje.
Za izvajanje svoje funkcije shramba podatkov vzdržuje funkcije v treh različnih plasteh. Ti vključujejo ustavljanje, integracijo in dostop. V postopku uprizoritve razvijalci shranijo surove podatke z izključnim namenom analize in podpore. Integracijska plast se uporablja za integracijo podatkov in za raven odvzema podatkov od uporabnikov podatkov. Nenazadnje je dostopna plast pomembna pri pridobivanju podatkov različnih uporabnikov podatkov.
Tako pridobivanje podatkov kot shranjevanje podatkov lahko označimo kot orodja, ki se uporabljajo za zbiranje poslovne inteligence. Glavna razlika obeh je, kako se zbira poslovna inteligenca. Zato lahko rečemo, da so podatki, ki so bili dobro skladiščeni, precej enostavni za pridobivanje in jih tako izkoristimo. Tako je skladišče podatkov odgovorno za olajšanje dela rudarjenja podatkov z nastanitvijo vseh ustreznih podatkov, ki jih je treba izkopati na osrednji lokaciji, in ne takrat, ko mora podatkovno rudarjenje še naprej iskati podatke na različnih lokacijah. To pomaga prihraniti čas, porabljen za rudarjenje podatkov, in vire, ki se uporabljajo pri rudarjenju.
Povzetek
Rudarjenje podatkov je postopek pridobivanja podatkov iz velikih nizov podatkov.
Shranjevanje podatkov je postopek združevanja vseh ustreznih podatkov.
Tako pridobivanje podatkov kot shranjevanje podatkov sta orodja za zbiranje poslovne inteligence.
Izvajanje podatkov je specifično pri zbiranju podatkov.
Skladiščenje podatkov je orodje za prihranek časa in izboljšanje učinkovitosti, saj povezuje podatke z različnih lokacij z različnih področij organizacije.
Skladišče podatkov ima tri plasti, in sicer urejanje, povezovanje in dostop.