Комп’ютер – складна машина, і при роботі на ньому можуть трапитись неприємності.
Може вийти з ладу вінчестер, пошкодитися дискета, програми і дані може зіпсувати вірус, нарешті, користувач може випадково знищити файл або цілий каталог.
Запобігти неприємностям можна, створивши архівні копії важливої інформації і
регулярно поновлюючи ці копії.
Архівація (упаковка) – це процес створення архіву. |
Стиснення – процес при якому видаляється все зайве, внаслідок чого зменшується розмір файлу. |
Такими зайвими даними у файлах можуть бути символи, що повторюються, постійні біти.
Принцип стискання інформації:
Практично принцип стискання інформації файлів в усіх архіваторах подібний:
знаходження фрагментів, що повторюються, і заміна їх більш короткими. Завдання архіватора – знайти ці фрагменти і записати замість них іншу інформацію, за допомогою якої можна було б «згадати», де, хто і за ким відповідний фрагмент стоїть.
Тепер давайте поміркуємо як же і на чому можливо економити місце при стисненні файлів. В деяких файлах зустрічаються досить довгі ланцюги однакових байтів.
|
|
Уявіть собі такий файл:
aaaaabbbccccccccccccccadddddddddddddddd {end of file}.
Файл займає на диску 39 байт. Зрозуміло, що інформація в файлі дещо надлишкова і зберігання файлу в такому вигляді недоцільне. Зовсім інша справа, якщо файл буде мати такий вигляд:
5a3b14ca16d {end of file}.
В такому випадку файл буде займати лише 11 байт. Слідуючи з цього файл можна записати більш економічно 39/11= 3,5 разів. На цьому ж прикладі можна описати ще один спосіб економії дискового місця. Як видно файл складається всього з чотирьох символів. Якщо співставити кожному з них пару бітів, то отримаємо:
a – "00",
b – "01",
c – "10",
d – "11".
Іншими словами файл можна закодувати таким чином, що кожен символ буде кодуватися не вісьмома, а двома бітами. І тоді економія буде чотирикратною (8/2=4). Слід зауважити, що цей варіант буде спільний і однаково ефективний навіть якщо в файлі немає жодного однакового ланцюга. Зауважте, що для застосування такого алгоритму кількісний склад представлений в файлі байт повинен бути неповним. Наприклад, якщо в файлі представлені 200 різних символів, то для однозначної ідентифікації кожного з них доведеться використати всі вісім біт (семи не вистачить, так як комбінації з семи біт можуть приймати лише 128 значень), що не дозволить досягнути ніяких результатів при використанні цього способу стиснення.
Отже, якщо ви зрозуміли суть приведених прикладів, то вам в повинні бути зрозумілі ідеї, згідно яким проходить стиснення файлів.
З деяких пір користувачу стало недостатньо тільки текстів. І користувачі отримали можливість зберігати на своїх жорстких дисках музику, зображення, відео. Всі ці файли також зберігаються в вигляді послідовності байтів. І якщо в тексті втрата хоча б одної букви або знака може мати фатальні наслідки, то в зображенні чи в відеокліпі інформація інколи наскільки надлишкова, що неминуче видалення частини інформації ніяким чином не вплине на сприйняття людини (за рахунок обмежень, які накладаються зором і слухом). Звідси і ряд методів стиснення даних.
|
|
Архіватор – комп'ютерна програма, що здійснює стиснення даних в один файл архіву для легшої їх передачі, та компактного зберігання. |
В якості даних зазвичай виступають файли і папки. Можливо створити архів, що складається з декількох файлів. В цьому випадку результатом роботи архіватора буде один архівний файл.
Сучасні архіватори (WINRAR, WINZIP) надають користувачеві повний спектр послуг для роботи з архівами, основними з яких є: 1. Створення нового архіву; 2. Додавання файлів в існуючий архів; 3. Розпакування файлів з архіву; 4. Створення архівів, що саморозпаковуються (self-extractor archive); 5. Захист архівів паролями від несанкціонованого доступу; 6. Перегляд вмісту файлів різних форматів без попереднього розархівування; 7. Пошук файлів і даних всередині архіву; 8. Перевірка на віруси в архіві до розпакування; 9. Вибір та налаштування коефіцієнта стиснення. |
Ефективність стиснення є однією з найважливіших характеристик архіваторів. Від неї залежить розмір створюваного файлу архіву. Чим менше архів, тим менше місця потрібно для його зберігання, а при передачі (наприклад по електронній пошті), потрібна менша пропускна спроможність каналу передачі та витрачається менше часу.
При виборі типу архіватора керуються наступними міркуваннями: ступінь стиснення повинен бути якомога вищий, а часу на упаковку і розпаковування файлів повинно йти якомога менше. |
Програма WinRAR має засоби для створення і перегляду архівів типу ZIP і RAR.