Sự khác biệt giữa GZIP và BZIP2 Sự khác biệt giữa

Anonim

GZIP vs BZIP2

GNU zip (còn gọi là GZIP) là một ứng dụng phần mềm với mục đích nén các tập tin. Nó ban đầu được dự định để thay thế cho chương trình nén được sử dụng trong các hệ thống Unix ban đầu - được sử dụng trong Dự án GNU (một dự án phần mềm tự do).

BZIP2 là một thuật toán nén dữ liệu không mất dữ liệu mã nguồn mở - về cơ bản, một lớp các thuật toán nén dữ liệu giúp cho dữ liệu ban đầu của một tệp nén được hoàn toàn tái tạo từ dữ liệu đã nén.

GZIP dựa trên một thuật toán được gọi là DEFLATE. Đây cũng là một thuật toán nén dữ liệu không mất dữ liệu. Nó sử dụng cả hai thuật toán LZ77 và Huffman mã hóa. Về cơ bản, GZIP đề cập đến định dạng tệp có cùng tên. Định dạng này là tiêu đề 10 byte có chứa số phép thuật (có nghĩa là giá trị số hoặc văn bản không bao giờ thay đổi và được sử dụng để biểu thị định dạng hoặc giao thức tệp, giá trị số chưa đặt tên mà không bao giờ thay đổi hoặc các giá trị khác biệt không thể nhầm đối với bất cứ thứ gì khác), các tiêu đề phụ có thể hoặc không thực sự cần thiết (tên tập tin ban đầu, ví dụ), một cơ quan có chứa một tải trọng nén DEFLATE (đó là dữ liệu mà các tiêu đề thực hiện), và một footer 8-byte chứa tổng kiểm tra CRC-32, cũng như độ dài thực tế của dữ liệu không nén.

Có nhiều kỹ thuật nén khác nhau mà định dạng BZIP2 sử dụng, được chồng xếp chồng lên nhau trên nhiều lớp. Chúng xuất hiện theo một trật tự rất đặc biệt: Chạy dài mã hóa (là bất kỳ chuỗi bốn đến 255 ký tự trùng lặp được thay thế bằng bốn ký hiệu đầu tiên, và chiều dài mã hóa lặp đi lặp lại từ 0 đến 251), chuyển đổi Burrows-Wheeler (đó là khối block đảo ngược tạo nên cốt lõi của BZIP2), Di chuyển về phía trước (bỏ kích thước của khối được xử lý không thay đổi), Chạy dài mã hóa (bao gồm các chuỗi ký hiệu dài - thường là zeros - mà liên tục lặp lại ở đầu ra, và được thay thế bằng cả biểu tượng và một dãy gồm hai mã), Huffman mã hóa (đó là một quá trình thay thế các ký tự chiều dài cố định của byte 8-bit với mã thay đổi chiều dài), nhiều Hoffman mã hóa (bao gồm nhiều bảng Hoffman có kích thước giống hệt nhau), mã hóa cơ sở Unary 1, mã hoá Delta, và mảng bit Sparse.

Tóm tắt:

1. GZIP là một ứng dụng miễn phí được sử dụng để nén các tập tin; BZIP2 là một thuật toán nén dữ liệu không mất dữ liệu mã nguồn mở giúp bạn có thể lấy được dữ liệu ban đầu của một tệp nén.

2. GZIP bao gồm tiêu đề 10 byte, tiêu đề tùy chọn, phần thân và phần chân dài 8 byte; BZIP2 bao gồm không ít hơn chín lớp kỹ thuật nén.