Forskel Mellem Semi Join og Bloom Deltag

Anonim

Semi Join vs Bloom Tilmeld

Semi join og Bloom join er to sammenføjningsmetoder, der bruges til forespørgselsbehandling for distribuerede databaser. Ved behandling af forespørgsler i distribuerede databaser skal data overføres mellem databaser på forskellige steder. Dette kan være en dyr operation afhængigt af mængden af ​​data, der skal overføres. Når du behandler forespørgsler i et distribueret databasemiljø, er det derfor vigtigt at optimere forespørgsler for at minimere mængden af ​​data, der overføres mellem websteder. Semi join og blom join er to metoder, der kan bruges til at reducere mængden af ​​dataoverførsel og udføre effektiv forespørgselsbehandling.

Hvad er Semi Join?

Semi join er en metode, der bruges til effektiv forespørgselsbehandling i distribuerede databasemiljøer. Overvej en situation, hvor en medarbejderdatabase (indeholdende oplysninger som medarbejderens navn, afdelingsnummer, hun arbejder for osv.) Placeret på websted 1 og en afdelingsdatabase (indeholdende oplysninger som afdelingsnummer, afdelingsnavn, placering osv.) Placeret på stedet 2. For eksempel, hvis vi ønsker at få medarbejdernavnet og afdelingens navn, som hun arbejder for (kun af afdelinger i "New York") ved at udføre en forespørgsel på en forespørgselsprocessor placeret på websted 3, er der flere måder at data kunne overføres mellem de tre steder for at opnå denne opgave. Men når data overføres, er det vigtigt at bemærke, at det ikke er nødvendigt at overføre hele databasen mellem webstederne. Kun nogle af de attributter (eller tuples), der kræves for tilmeldingen, skal overføres mellem webstederne for at udføre forespørgslen effektivt. Semi join er en metode, der kan bruges til at reducere mængden af ​​data, der sendes mellem webstederne. I semi-tilslutning overføres kun tilslutningskolonnen fra et sted til et andet, og den overførte kolonne bruges til at reducere størrelsen af ​​de afsendte forbindelser mellem de andre websteder. I ovenstående eksempel kan du bare overføre afdelingens navn og afdelingens navn til stedstedet med placering = "New York" fra sted 2 til sted 1 og udføre tilslutningen på websted 1 og overføre den endelige relation tilbage til websted 3.

Hvad er Bloom Tilmeld?

Som nævnt tidligere er blomstrende en anden metode, der bruges til at undgå overførsel af unødvendige data mellem websteder, når der udføres forespørgsler i et distribueret databasemiljø. I blomstersammenføjning overføres i stedet for at overføre selve kolonnen, en kompakt gengivelse af kolonnen overføres mellem webstederne. Bloom join bruger et blomst filter, der anvender en smule vektor til at udføre medlemskab forespørgsler. For det første er et blomstfilter bygget ved hjælp af tilslutningskolonnen, og det overføres mellem lokaliteterne, og derefter tilsluttes operationerne.

Hvad er forskellen mellem Semi Join og Bloom Join?

Selvom både semi-join- og blomstringsamfundsmetoder bruges til at minimere mængden af ​​data, der overføres mellem webstederne, når de udfører forespørgsler i et distribueret databasemiljø, blomstrer medvirker, reducerer mængden af ​​data (antal tupler), der overføres i forhold til semi-tilslutningen ved at udnytte begrebet blomfiltre, der anvender en smule vektor til at bestemme sætte medlemskaber. Derfor bliver det mere effektivt at bruge blomsterknap end at bruge semi-tilslutning.