Skladiščenje podatkov je sistem, namenjen shranjevanju in organiziranju podatkov v centralnih skladiščih, vključno s podatki iz drugih virov. Gre za temeljni koncept poslovne inteligence v modelih relacijskih baz podatkov, ki uporablja analitične tehnike za integracijo poslovnih podatkov v osrednjo bazo podatkov.
Obstajata dva običajna arhitekturna modela, ki se uporabljata pri shranjevanju podatkov:
Oba sta skupna večdimenzionalna modela baz podatkov, ki se uporabljata za potrebe velikih baz podatkov za analitične namene v resničnih skladiščih podatkov.
Predstavljamo nepristransko primerjavo med obema, da bi bolje razumeli, kateri je boljši od drugega.
Je najpogostejši in široko sprejet arhitekturni model, ki se uporablja za razvoj skladišč podatkov in podatkovnih zbirk, v katerih so podatki organizirani v dejstva in dimenzije. Je najpreprostejši arhitekturni model, v katerem se ena tabela dejstev uporablja za sklicevanje na več dimenzijske tabele, ki posnemajo zvezdni vzorec.
Kot pove že ime, je diagram podoben zvezdi s tabelo dejstev na sredini in več tabel dimenzij, ki sevajo iz nje, kar ustvarja vzorec, podoben zvezdi.
Znana je tudi kot shema za pridružitev zvezdi in hrani vse atribute dimenzije v eno denormalizirano tabelo dejstev, da se hitro pomika po velikih večdimenzionalnih naborih podatkov, kar predstavlja hiter odzivni čas.
Gre za razširitev zvezdaste sheme z dodanimi funkcionalnostmi. Za razliko od sheme zvezd so tabele dimenzij v shemi snežinke normalizirane v več povezanih tabel.
Arhitekturni model predstavlja logično razporeditev tabel v hierarhiji odnosov med seboj, kjer so več dimenzijske tabele normalizirane v poddimenzionalne tabele, podobne vzorcu snežinke, od tod tudi ime.
Gre za bolj zapleteno različico sheme zvezd z več povezavami med dimenzijskimi tabelami, ki upošteva počasen čas obdelave za pridobivanje podatkov, kar pomeni počasne odzivne čase. Zmanjša odvečnost podatkov, kar posledično izboljša uspešnost poizvedb.
V relacijskih bazah podatkov je zvezdna shema najpreprostejši arhitekturni model, ki se uporablja za razvoj podatkovnih skladišč in večdimenzionalnih podatkovnih skodel. Kot že ime pove, model spominja na zvezdo s točkami, ki sevajo od središča, kar pomeni, da je tabela dejstev središče, točke pa tabele dimenzij. Kot drugi dimenzijski modeli je tudi ta sestavljen iz podatkov v obliki dejstev in dimenzij. Shema Snowflake je na drugi strani bolj zapleten arhitekturni model, ki se nanaša na večdimenzionalno bazo podatkov z logično razporeditvijo tabel v obliki snežinke.
Shema snežinke je precej podobna shemi zvezd, le da ima lahko več kot eno dimenzijsko tabelo, ki se nadalje normalizira v več povezanih tabel, imenovanih poddimenzionalne tabele. Predstavlja več ravni odnosov, ki se razvejajo v vzorec snežinke. Vendar zvezdna shema shrani vse povezane atribute dimenzije v eno tabelo dimenzijske dimenzije, kar olajša razumevanje in upravljanje preprostejših poizvedb.
Tabela dimenzij ne more vsebovati podvojenih vrstic v relacijskih modelih baz podatkov zaradi preprostega dejstva, da bi lahko ustvarila nejasnosti pri iskanju. Vsaka tabela mora imeti stolpec ali kombinacijo stolpcev, imenovanih primarni ključ, ki enotno identificira vse zapise tabel. Tuji ključ je stolpec ali skupina stolpcev, ki zagotavlja povezavo med dvema tabelama. V shemi zvezd ima vsaka tabela dimenzij primarni ključ, ki je povezan s tujim ključem v tabeli dejstev. Poslovna hierarhija v shemi snežinke je predstavljena z razmerjem primarni ključ / tuji ključ med dimenzijskimi tabelami.
Ključna razlika med obema modeloma relacijskih baz podatkov je normalizacija. Tabele dimenzij v zvezdni shemi niso normalizirane, kar pomeni, da bo poslovni model porabil razmeroma več prostora za shranjevanje dimenzijskih tabel, več prostora pa pomeni več odvečnih zapisov, kar bi na koncu povzročilo neskladnost. Shema Snowflake na drugi strani zmanjšuje odvečnost podatkov, ker so normalizirane tabele dimenzij, kar predstavlja precej manj odvečnih zapisov. Poslovna hierarhija in njene dimenzije se ohranjajo prek referenčne celovitosti, kar pomeni, da se lahko odnosi neodvisno posodobijo v podatkovnih skladiščih.
Zvezdna shema ima manj povezav med tabelo dimenzij in tabelo dejstev v primerjavi s shemo snežinke, ki ima več spojev, kar predstavlja manjšo zapletenost poizvedb. Ker so dimenzije v zvezdni shemi povezane preko osrednje tabele dejstev, ima jasne poti povezovanja, kar pomeni hiter odzivni čas in hiter odzivni čas pomeni boljšo zmogljivost. Shema Snowflake ima večje število pridružij, zato daljši odzivni časi, kar povzroči bolj zapletene poizvedbe, kar na koncu ogrozi uspešnost.
Oba sta najpogostejša in široko sprejeta arhitekturna modela, ki se uporabljata za razvoj skladišč podatkovnih baz in podatkovnih podatkov. Vendar ima vsak poslovni model svoj pravični del prednosti in slabosti. Medtem ko je shema zvezd najpreprostejši večdimenzionalni model, ki se uporablja za organiziranje podatkov v dejstva in dimenzije, je idealen za razvoj podatkovnih točk, ki vključujejo manj zapletene odnose. Shema snežinke je logični prikaz tabel v večdimenzionalni bazi podatkov, v katerih so dimenzije shranjene v poddimenzionalnih tabelah. Glavna razlika med obema je normalizacija. Tabele dimenzij v shemi snežinke so popolnoma normalizirane v več preglednih preglednic, medtem ko so v shemi zvezda tabele dimenzij denormalizirane v eno osrednjo tabelo dejstev.