Sự khác biệt giữa Semi Join và Bloom Tham gia

Anonim

Semi Join & Bloom Tham gia

Kết hợp semi join và Bloom là hai phương thức kết hợp được sử dụng trong xử lý truy vấn cho các cơ sở dữ liệu phân tán. Khi xử lý các truy vấn trong cơ sở dữ liệu phân tán, dữ liệu cần được chuyển giao giữa các cơ sở dữ liệu nằm ở các vị trí khác nhau. Đây có thể là một hoạt động đắt tiền tùy thuộc vào số lượng dữ liệu cần phải được chuyển giao. Do đó, khi xử lý truy vấn trong môi trường cơ sở dữ liệu phân tán, điều quan trọng là phải tối ưu hóa các truy vấn để giảm thiểu số lượng dữ liệu được truyền giữa các trang web. Liên kết semi-join và bloom là hai phương pháp có thể được sử dụng để giảm lượng dữ liệu truyền và thực hiện xử lý truy vấn hiệu quả.

Đăng ký bán là gì?

Semi join là một phương pháp được sử dụng để xử lý truy vấn hiệu quả trong một môi trường cơ sở dữ liệu phân tán. Xem xét tình huống nơi một cơ sở dữ liệu của nhân viên (giữ thông tin như tên nhân viên, số phận của cô ấy đang làm việc, v.v …) tại địa điểm 1 và cơ sở dữ liệu của Cơ quan (giữ thông tin như số phòng, tên bộ phận, vị trí, v.v …) 2. Ví dụ: nếu chúng ta muốn lấy tên nhân viên và tên bộ phận mà cô ấy đang làm (chỉ các phòng ban ở New York), bằng cách thực hiện một truy vấn tại bộ xử lý truy vấn ở trang 3, có một số cách dữ liệu có thể được chuyển giao giữa ba trang web để đạt được nhiệm vụ này. Nhưng khi chuyển dữ liệu, điều quan trọng cần lưu ý là không cần chuyển toàn bộ cơ sở dữ liệu giữa các trang web. Chỉ cần một số thuộc tính (hoặc tuples) được yêu cầu cho sự tham gia cần phải được chuyển giữa các trang web để thực hiện truy vấn hiệu quả. Semi join là một phương pháp có thể được sử dụng để giảm lượng dữ liệu được vận chuyển giữa các trang web. Trong semi-join, chỉ có cột join được chuyển từ site này sang site khác và sau đó cột đã được chuyển tiếp được sử dụng để giảm kích thước của mối quan hệ đã được shipped giữa các site khác. Đối với ví dụ trên, bạn chỉ có thể chuyển số phòng và bộ phận của bộ với vị trí = "New York" từ trang web 2 đến trang 1 và thực hiện việc gia nhập tại trang 1 và chuyển mối quan hệ cuối cùng trở lại trang web 3.

Bloom tham gia là gì?

Như đã đề cập trước đó, bloom join là một phương pháp khác được sử dụng để tránh chuyển dữ liệu không cần thiết giữa các trang khi thực hiện truy vấn trong một môi trường cơ sở dữ liệu phân tán. Trong bloom join, thay vì tự chuyển đổi cột kết nối, một đại diện nhỏ gọn của cột kết nối được chuyển giao giữa các trang web. Bloom tham gia sử dụng một bộ lọc nở sử dụng một vector bit để thực hiện truy vấn thành viên. Thứ nhất, một bộ lọc nở được xây dựng bằng cách sử dụng cột kết nối và nó được chuyển giao giữa các vị trí và sau đó các hoạt động gia nhập được thực hiện.

Sự khác nhau giữa Semi Join và Bloom Join là gì?

Mặc dù các phương thức join semi-join và bloom được sử dụng để giảm thiểu số lượng dữ liệu truyền giữa các site khi thực hiện các truy vấn trong môi trường cơ sở dữ liệu phân tán, bloom join làm giảm số lượng dữ liệu (số tuple) được chuyển đi so với semi join bằng cách sử dụng các khái niệm về các bộ lọc nở, sử dụng một vector bit để xác định thành viên thiết lập. Vì vậy, sử dụng nở hợp sẽ hiệu quả hơn bằng cách sử dụng bán tham gia.