Код Шеннона

Код Шеннонапозволяет построить почти оптимальный код с длинами кодовых слов L_i < - log p_i +1. Тогда L_cp <H(p₁, …,p_n) +1. Код Шеннона строится следующим образом.

1. Упорядочим символы исходного алфавита А={ a₁,a₂,…,a_n } по убыванию их вероятностей: p₁≥p₂≥p₃≥…≥p_n.

2. Составим нарастающие суммы вероятностей Q_i:

Q₀=0, Q₁=p₁, Q₂=p₁+p₂, Q₃=p₁+p₂+p₃, …, Q_n=1.

3. Представим Q_i в двоичной системе счисления и возьмем в качестве кодового слова первые é- log₂ p_i ù знаков после запятой.

Для вероятностей, представленных в виде десятичных дробей, удобно определить длину кодового слова L_i из соотношения

, .

Пример. Пусть дан алфавит A={ a₁, a₂, a₃, a₄, a₅, a₆ } с вероятностями p₁ =0.36, p₂ =0.18, p₃ =0.18, p₄ =0.12, p₅ =0.09, p₆ =0.07. Построенный код приведен в таблице.

Таблица 11 Код Шеннона

a_i	P_i	Q_i	L_i	кодовое слово
a₁ a₂ a₃ a₄ a₅ a₆	1/2²≤0.36<1/2 1/2³≤0.18<1/2² 1/2³≤0.18<1/2² 1/2⁴≤0.12<1/2³ 1/2⁴≤0.09<1/2³ 1/2⁴≤0.07<1/2³	0.36 0.54 0.72 0.84 0.93

Построенный код является префиксным. Вычислим среднюю длину кодового слова и сравним ее с энтропией. Значение энтропии вычислено при построении кода Хаффмена (H = 2.37).

L_ср = 0.36 ^. 2+(0.18+0.18) ^. 3+(0.12+0.09+0.07) ^. 4=2.92< 2.37+1