double arrow

Основные понятия. Как хранение, так и передача данных требует затрат участников информационного процесса

Сжатие данных

Как хранение, так и передача данных требует затрат участников информационного процесса. Зная стоимость устройства хранения данных и его емкость (Мбайт, Гбайт, Тбайт) можно подсчитать, во что обходится хранение единицы данных, а зная пропускную способность канала связи (кбит/с, Мбит/с,Гбит/с) и стоимость его аренды, можно определить затраты на передачу единицы данных. Полученные результаты обычно составляют вполне значимые величины как для корпоративных пользователей, так и для индивидуальных. В связи с этим, регулярно возникает необходимость уменьшать объем данных (сжимать данные) перед тем, как размещать их на длительное время в устройствах хранения данных или передавать их по каналам связи. Соответственно, существует и необходимость восстановления исходных данных из сжатых.

Актуальность проблемы сжатия данных подтверждается наличием «Сообщества сжатия данных» и ежегодно проводимой в г. Сноуборде США Конференции по сжатию данных (Data Compression Conference) https://www.cs.brandeis.edu/dcc/index.html. Каждый год на конференции присуждается премия имени Капочелли за самую интересную студенческую работу в области сжатия данных. Труды конференции издаются в IEEE Computer Society (https://computer.org/).

Сжатие данных в вычислительной технике и системах связи (используются также термины архивация данных, когда сжатие применяется к готовым документам; программные средства, выполняющие эти операции, называют архиваторами, например, WinZip, WinRAR, WinArj, PKZIP.EXE, RAR.EXE, ARJ.EXE; используется и синонимы слова сжатие упаковка, компрессия) - это процесс кодирования массивов данных таким образом, чтобы объем занимаемый полученым кодом в запоминающих устройствах, был бы, по возможности минимальным.

При этом процесс сжатия должен быть полностью или частично обратимым, т.е. должна существовать обратная процедура, называемая декодированием (распаковкой, разархивацией), позволяющая восстановить из сжатых данных набор данных, в той или иной мере соответствующий исходным данным.

Такое определение под сжатием понимает следующие процедуры преобразования данных: неискажающее сжатие цифровых данных, сжатие цифровых данных с регулируемыми потерями, получение экономного представления входного аналогового сигнала.

При неискажающем сжатии цифровых данных исходный массив цифровых данных (исходное сообщение) представляется таким образом, чтобы получить минимизированный объем закодированных данных. Сжатие должно быть полностью обратимым, т.е. должна существовать процедура, позволяющая восстановить из сжатых данных точную копию исходного массива данных. Подчеркивая эту особенность, такой процесс часто называют сжатием без потерь, обратимым сжатием. Исходные данные представляются каким-либо двоичным кодом: коды символов текста, команд процессора, яркости точек растрового изображения, амплитуды аналогового сигнала, ссылки на другие фрагменты данных.

При сжатии цифровых данных с регулируемыми потерями обеспечивается экономное представление цифровых данных, но процедура сжатия не является полностью обратимой, т.е. распаковка не позволяет во всех случаях восстановить исходный массив данных до отдельного бита. Как правило, потери допускаются только в той части данных, которая не является существенной при дальнейшем использовании распакованного сообщения. Ясно, что в общем случае «существенность» потерь данных оценить невозможно, поэтому сжатие с потерями допускается только для данных, которые допускают некоторую потерю. Обычно это аналоговые по своей природе данные, например, оцифрованные изображения или звук: цифровые фотографии, видеоряды, звукозаписи.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: