Forskel mellem GZIP og BZIP2 Forskel mellem

Anonim

GZIP vs BZIP2

GNU zip (også kendt som GZIP) er et softwareprogram med det formål at komprimere filer. Det var oprindeligt beregnet til at erstatte kompressprogrammet, der blev brugt i de tidlige Unix-systemer - til brug i GNU Project (et gratis software-projekt).

BZIP2 er en open source lossless datakomprimeringsalgoritme - dybest set en klasse af datakomprimeringsalgoritmer, der gør det muligt for de oprindelige data i en komprimeret fil at blive fuldstændigt rekonstrueret fra komprimerede data.

GZIP er baseret på en algoritme kendt som DEFLATE. Dette er også en tabsfri datakompression algoritme. Den bruger både LZ77-algoritmen og Huffman-kodningen. I det væsentlige refererer GZIP til filformatet med samme navn. Dette format er en 10-byte overskrift, som indeholder et magisk nummer (hvilket betyder en numerisk eller tekstværdi, der aldrig ændres og bruges til at betegne et filformat eller en protokol, en navngivet numerisk værdi, der aldrig ændres eller forskellige værdier, der ikke kan forveksles for noget andet), ekstra overskrifter, der måske eller måske ikke er nødvendige (f.eks. originalt filnavn), en krop, der indeholder en DEFLATE-komprimeret nyttelast (som er de data, som overskrifterne bærer) og en 8-byte banner som indeholder et CRC-32 checksum, samt den faktiske længde af de originale ukomprimerede data.

Der findes en række komprimeringsteknikker, som BZIP2-formatet bruger, som stables oven på hinanden i flere lag. De forekommer i en meget særskilt rækkefølge: Kørselslængde-kodning (som er en sekvens af fire til 255 dobbelt symboler, der erstattes af de første fire symboler og en længde af kodning, der gentager mellem 0 og 251), Burrows-Wheeler transform som er den reversible blok-sortering, der udgør selve kernen i BZIP2), Flyt til front (efterlader størrelsen af ​​den behandlede blok uændret), Kodlængde-kodning (som består af lange tråde af symboler - normalt nuler - som konstant gentag i udgangen og erstattes af både symbolet og en sekvens af to koder), Huffman-kodning (som er en proces, der erstatter symboler med fast længde på 8-bit byte med ændrede længdekoder), Multiple Hoffman-kodning (som består af flere Hoffman-borde af samme størrelse), Unary base 1-kodning, Delta-kodning og Sparse bit array.

Sammendrag:

1. GZIP er et gratis program, der bruges til at komprimere filer; BZIP2 er en open source lossless datakomprimeringsalgoritme, der gør det muligt at hente de oprindelige data i en komprimeret fil.

2. GZIP består af en 10-byte header, valgfri overskrifter, en krop og en 8-byte footer; BZIP2 består af ikke færre end ni lag kompressionsteknikker.