Razlika med Semi Join in Bloom Join

Semi Join proti Bloom Join

Semi join in Bloom join sta dve metodi združevanja, ki se uporabljata pri obdelavi poizvedb za porazdeljene baze podatkov. Pri obdelavi poizvedb v razdeljenih bazah podatkov je treba podatke prenašati med bazami podatkov, ki se nahajajo na različnih mestih. To bi lahko bilo drago delovanje, odvisno od količine podatkov, ki jih je treba prenesti. Zato je pri obdelavi poizvedb v okolju porazdeljene baze podatkov pomembno optimizirati poizvedbe, da se količina podatkov, prenesenih med spletnimi mesti, čim bolj zmanjša. Semi join in bloom join sta dve metodi, s katerima lahko zmanjšate količino prenosa podatkov in izvedete učinkovito obdelavo poizvedb.

Kaj je Semi Join?

Semi join je metoda, ki se uporablja za učinkovito obdelavo poizvedb v okolju porazdeljene baze podatkov. Razmislite o situaciji, v kateri se baza podatkov zaposlenega (ki vsebuje podatke, kot so ime zaposlenega, številka oddelka, za katere dela itd.), Nahaja na mestu 1 in baze podatkov oddelka (vsebuje podatke, kot so številka oddelka, ime oddelka, lokacija itd.) 2. Če želimo na primer pridobiti ime zaposlenega in ime oddelka, za katerega dela (samo oddelke, ki se nahajajo v "New Yorku"), z izvedbo poizvedbe v poizvedovalnem procesorju na mestu 3, obstaja več načinov, da Za dosego te naloge bi bilo mogoče podatke posredovati med tremi mesti. Toda pri prenosu podatkov je pomembno upoštevati, da ni potrebno prenašati celotne baze podatkov med spletnimi mesti. Za učinkovito izvedbo poizvedbe je treba med spletnimi mesti prenesti le nekatere atribute (ali tuple), ki so potrebni za združitev. Semi join je metoda, s katero lahko zmanjšate količino podatkov, poslanih med spletnimi mesti. Pri polčasnem združevanju se z enega mesta na drugo prenese samo stolpec pridruži, nato pa se preneseni stolpec uporabi za zmanjšanje velikosti odposlanih odnosov med drugimi mesti. Za zgornji primer lahko preprosto prenesete številko oddelka in ime oddelka tuples z lokacijo = "New York" z mesta 2 na spletno mesto 1 in izvedete pridruževanje na mestu 1 in prenesite končni odnos nazaj na spletno mesto 3.

Kaj je Bloom Join?

Kot smo že omenili, je bloom pridruživanje druga metoda, ki se uporablja za preprečevanje prenosa nepotrebnih podatkov med spletnimi mesti pri izvajanju poizvedb v okoljih porazdeljene baze podatkov. Namesto prenosa samega stolpca v blomu se kompaktni prikaz stolpca za združevanje prenese med mesta. Bloom join uporablja filter za cvetenje, ki za izvedbo poizvedb o članstvu uporablja malo vektorja. Najprej je zgrajen filter za cvetenje s pomočjo stolpca za združevanje, ki ga prestavimo med mesta in nato izvedemo operacije združevanja.

Kakšna je razlika med Semi Join in Bloom Join?

Čeprav se metode dvojnega združevanja in združevanje v razcvetu uporabljajo za zmanjšanje količine podatkov, prenesenih med spletnimi mesti pri izvrševanju poizvedb v okolju porazdeljene baze podatkov, bloom pridruživanje zmanjša količino prenosa podatkov (število naborov) v primerjavi s pol pridruževanjem z uporabo koncept cvetočih filtrov, ki uporabljajo malo vektorja za določitev nastavljenega članstva. Zato bo uporaba bloom pridruževanja bolj učinkovita kot uporaba semi join.