GZIP срещу BZIP2
GNU zip (известен също като GZIP) е софтуерно приложение с цел компресиране на файлове. Първоначално е имало за цел да замени програмата за компресиране, използвана в ранните системи на Unix - да се използва в проекта GNU (безплатен софтуер).
BZIP2 е алгоритъм за компресиране на данни с отворен код - по същество клас алгоритми за компресиране на данни, който дава възможност първоначалните данни на компресиран файл да бъдат напълно реконструирани от компресираните данни.
GZIP се основава на алгоритъм, известен като DEFLATE. Това също е алгоритъм за компресиране на данни без загуби. Той използва както алгоритъм LZ77, така и кодиране на Huffman. По същество GZIP се отнася до едноименния файлов формат. Този формат е 10-байтова заглавка, която съдържа магическо число (което означава числова или текстова стойност, която никога не се променя и се използва за означаване на файлов формат или протокол, неназована цифрова стойност, която никога не се променя, или различни стойности, които не могат да бъдат сбъркани за всичко останало), допълнителни заглавки, които могат или не могат да бъдат действително необходими (оригиналното име на файл, например), орган, който съдържа DEFLATE-компресиран полезен товар (това са данните, които носят заглавките) и 8-байтов футър която съдържа контролна сума CRC-32, както и действителната дължина на оригиналните некомпресирани данни.
Има различни техники за компресиране, които форматът BZIP2 използва, които са подредени един върху друг в няколко слоя. Те се осъществяват в много отличителен ред: кодиране с дължина на изпълнение (което е всяка последователност от четири до 255 дублиращи символа, която се заменя с първите четири символа, и дължина на кодиране, която се повтаря между 0 и 251), трансформация на Burrows-Wheeler ( който е обратим блок сортиране, който съставя самото ядро на BZIP2), Преместване напред (оставя размера на обработения блок непроменен), Кодиране с дължина на изпълнение (което се състои от дълги нишки символи - обикновено нули - които постоянно се повтарят в изхода и се заменят както от символа, така и от последователност от два кода), кодиране на Huffman (което е процес, който замества символите с фиксирана дължина от 8-битови байта с кодове с променяща се дължина), множествено кодиране на Hoffman (които се състоят от множество таблици на Hoffman с еднакъв размер), Unary база 1 кодиране, Delta кодиране и рядък битов масив.
Резюме:
1. GZIP е безплатно приложение, използвано за компресиране на файлове; BZIP2 е алгоритъм за компресиране на данни с отворен код, който дава възможност за извличане на оригиналните данни на компресиран файл.
2. GZIP се състои от 10-байтово заглавие, незадължителни заглавки, тяло и 8-байтов футър; BZIP2 се състои от не по-малко от девет слоя на техники за компресия.