Энтропия и эффективность кодирования

Рассмотрим случайную переменную с множеством возможных значений (х₁ х₂,..., x_N), принимаемых с вероятностями (P₁, Р₂,..., P_n), где Р, означает вероятность результата x_i. Определим нижнюю границу средней длины кода. Мы знаем, что мерой информации для х_i является log(1/Р). Поэтому в идеальном случае мы сможем представить значение x_i - кодовым словом длины L_i = log(l/P_i) бит. Однако в большинстве случаев log(l/P_i) не является целым числом, и лучшее, что мы можем сделать, — это выбрать ближайшее целое число L_i такое что

Умножая на Р_i и суммируя по всем кодовым словам, получаем:

Таким образом, оптимальный код позволяет получить среднюю длину кода, не более чем на 1 бит превосходящую энтропию оригинального набора символов. Таким образом, энтропия случайной переменной X может интерпретироваться как минимальное среднее число битов, необходимых для отображения одного значения X.

Можно показать, что код Хаффмана удовлетворяет данному неравенству. Пример приводится в таблице. Средняя длина кода составляет 2,184, а энтропия равна 2,167. Обратите внимание на то, что не все отдельные кодовые слова удовлетворяют неравенству. Однако в среднем это неравенство выполняется.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

4 5 6 7 8 9 10

Эластичность предложения

Виды юридических лиц

Субъект, объект, объективная, субъективная стороны правонарушения

Соотношение законности и правопорядка

Раннее средневековье. Апологетика. Патристика. Схоластика

Технология приготовления заправочных супов

Самый сильный аргумент, почему эволюция человека не могла быть