Основные понятия

Сжатие информации

При проектировании информационных систем часто необходимо минимизировать затраты на передачу и хранение информации. Добиться этого можно с помощью кодирования, устраняющего избыточность информации. При решении практических задач такое кодирование называют сжатием информации. При сжатии информации, изначально представленной в дискретном виде, говорят о сжатии данных. При этом часто говорят, что сжимается файл или поток данных. Для описания методов сжатия данных используются следующие основные понятия и характеристики.

Компрессор или кодер – программа (устройство), которая сжимает исходные данные, т.е. преобразует входной несжатый файл в выходной сжатый файл. Программа (устройство), выполняющая обратное преобразование (восстановление исходных данных из сжатого файла), называется декомпрессором или декодером. Компрессор и декомпрессор вместе образуют кодек.

Методы сжатия данных делятся на неадаптивные, адаптивные, полуадаптивные и локально адаптивные методы. Неадаптивный метод сжатия данных (метод неадаптивного сжатия данных) – метод сжатия данных, в котором не предусмотрена возможность изменения операций, параметров и настроек в зависимости от характера сжимаемой информации. Метод, в котором предусмотрена возможность изменения операций, параметров и настроек в зависимости от характера сжимаемых данных, называется адаптивным методом. Если для изменения операций, параметров и настроек предварительно собирается некоторая статистика сжимаемой информации, то метод сжатия называется полуадаптивным (говорят, что реализуется двухпроходное сжатие: на первом проходе выполняется анализ информации, а на втором – собственно сжатие). Метод сжатия называется локально адаптивным, если в нем предусмотрена возможность изменения параметров в зависимости от локальных особенностей входного файла.

Методы сжатия данных делятся также на методы сжатия без потерь и с потерями информации. Метод сжатия без потерь (метод неискажающего сжатия) позволяет восстановить сжатую информацию без искажений. Метод сжатия с потерями (метод искажающего сжатия) предусматривает искажение сжимаемой информации для получения требуемых характеристик сжатия (скорости, качества, простоты и т.д.).

Симметричный метод сжатия – это метод, при использовании которого кодер и декодер выполняют одни и те же действия, но в противоположных направлениях. Если либо кодер, либо декодер выполняет значительно большую работу, то соответствующий метод сжатия называется асимметричным.

Для определения производительности метода сжатия данных часто используют коэффициент сжатия, фактор сжатия, качество сжатия, время сжатия и время восстановления. Коэффициент сжатия – величина, получающаяся в результате деления размера выходного (сжатого) файла на размер входного (несжатого) файла. Фактор сжатия – величина, обратная коэффициенту сжатия. Качество сжатия определяется по формуле

выражается в процентах и показывает на сколько процентов уменьшается размер исходного файла после сжатия. Время сжатия – это время, затрачиваемое на сжатие данных. Время восстановления – это время, необходимое для восстановления данных из сжатого файла.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: