Кодирование и декодирование

Дискретное сообщение, формируемое источником (отправите­лем), представляет собой последовательность знаков1, выбира­емых из определенного набора. Например, перед отправкой теле­граммы (сообщение) человек составляет ее текст, употребляя при этом буквы и символы из набора (алфавита), известного ему и получателю. Счетчик расхода ленты магнитофона выдает сведе­ния в виде десятичного числа. Набор знаков, из которых форми­руется сообщение, называется первичным алфавитом или алфа­витом сообщения. Количество знаков в этом алфавите Ма быва­ет различным, но обычно достаточно большим. Так, в русском языке для сообщения в виде текста используется набор из 33 букв, 10 цифр, более 15 различных условных знаков (пробел, точ­ка, запятая, сложение, вычитание, умножение и т. д.). В некото­рых других языках, особенно восточных, набор знаков первич­ного алфавита еще больше.

Для преобразования последовательности знаков дискретного сообщения в первичный сигнал сначала производится их кодиро­вание, т. е. каждый знак сообщения акзаменяется комбинацией из небольшого числа стандартных символов, а далее эти стан­дартные символы преобразуются в стандартные электрические сигналы u1 (рис. 1.2). Необходимость перехода в электросвязи к изображению знаков первичного алфавита небольшим числом стандартных сигналов связано с тем, что из-за действия помех в приемнике легче принимать небольшое число сигналов.

Количество стандартных символов, с помощью которых про-изводится отображение знаков сообщения, называется вторич­ным алфавитом, или основанием кода. Процесс перехода от первичного сообщения к его вторичному отображению называется кодированием, а правило, по которому осуществляется такой пе-ход, называется кодом. Таким образом, кодалгоритм (пра-вило) перехода от первичного алфавита ко вторичному.

В результате кодирования каждый знак сообщения представ-ляется в виде последовательности символов вторичного алфавита —кодовых комбинаций.

Рис. 1.2 Преобразование сообщений при кодировании[1]

Характерным примером кода для пе­редачи буквенно-цифровых текстов является код Морю. В этом коде в качестве символов используются точки, паузы разной дли­тельности, тире. В двоичном коде, например Бодо, используются лишь два различных символа, обозначаемых как 0 и 1.

Кодирование может осуществляться вручную или автомати­чески. Устройство, осуществляющее операцию кодирования ав­томатически, называют кодером. Обратная операция, т. е. восста­новление знаков сообщения из кодовых комбинаций, называется декодированием, а устройство, выполняющее эту операцию — де­кодером. Обычно кодер и декодер выполняют также операции преобразования символов в первичный сигнал и первичного сиг­нала в символы. Часто кодер и декодер объединяются в единое устройство — кодек.

Основными параметрами любого кода являются: первичный алфавит или алфавит сообщения Ма — число знаков сообщения, которое необходимо закодировать; вторичный алфавит, или осно­вание кода m — число символов, с помощью которых производит­ся кодирование, отличающихся друг от друга по каким-либо фи­зическим признакам; значность или разрядность кода n число символов вторичного алфавита в кодовой комбинации.

Коды могут быть заданы различными способами. Простейший и самый распространенный из них — табличный. При этом код имеет вид таблицы из двух колонок, в одной из которых разме­щены знаки первичного алфавита, а в другой — соответствую­щие им кодовые комбинации вторичного. В табл. П.1 приведены используемые в настоящее время коды для телеграфной переда­чи текста — код Морзе и МТК-2 (Международный телеграфный код № 2, доработанный с учетом особенностей русского языка). Следует отметить, что в литературе часто любой пятиразрядный код (n=5) называют кодом Бодо, в честь французского изобре­тателя Ж. Бодо, который в 1877 году создал первую практичес­ки пригодную систему последовательного телеграфирования на основе пятиразрядного кода. Однако код Бодо и МТК-2 отлича­ются таблицей соответствия знаков и кодовых комбинаций. В не­которых случаях код задают в виде графика, который дает бо­лее наглядное представление о кодовых комбинациях.

Классификация кодов. В зависимости от параметров различают следующие основные группы кодов.

Равномерные, все кодовые комбинации которых состоят из одинакового числа символов (n=const). Код Бодо, МТК-2 — равномерные коды. Для равномерного кода общее число кодовых комбинаций при заданных основании m и значности n

М0=mn (1.1)

Неравномерные, имеющие разное число символов в кодовых комбинациях,(n¹const). Примером неравномерного кода являетcz

код Морзе.

Простые, или коды без избыточности, в которых для отобра­жения первичного алфавита используются все кодовые комбина­ции а=Мо).

Корректирующие коды, или коды с избыточностью, в которых используются не все кодовые комбинации а0). Наличие не­используемых (избыточных) кодовых комбинаций является необ­ходимым условием для построения корректирующих кодов, поз­воляющих при декодировании обнаруживать и исправлять ошибки.

Двоичные коды, кодовые комбинации которых представляют собой сочетания из двух различных элементов 1 и 0.

Многопозиционные (недвоичные) коды имеют основание ко­да m>2.

В настоящее время в технике связи и при обработке инфор­мации на ЭВМ особое значение имеют двоичные коды. Это свя­зано с простотой технической реализации как кодов, так и кана­лов связи для них.

Пример 1.1. Определить число кодовых комбинаций кода Бодо. Пригоден ли этот код для непосредственной передачи русского текста (букв, цифр, зна­ков препинания)?

Код Бодо является двоичным (m = 2), пятиразрядным (n=5) и согласно (1.1) M0 = 25 = 32. Поскольку русский текст содержит около 50 различных зна­ков первичного алфавита (Ма»50), код Бодо не может быть непосредственно использован для передачи русского текста, так как Ма>Мо.

Примечание. Однако пятиразрядный код уже более 100 лет используется в телеграфных аппаратах. Для этого введена так называемая система регист­ров, суть которой в том, что одни и те же кодовые комбинации используются для отображения двух и даже трех знаков первичного алфавита. Например, в МТК-2 комбинация 11010 означает букву Й и цифру 8, и ее смысл опреде­ляется тем, какая перед этим была последняя регистровая кодовая комбина­ция. Так, если комбинация 11010 следует после комбинации 11011, она озна­чает цифру 8, а если после комбинации 00000 — русскую букву Й. Однако такая регистровая система обладает низкой помехоустойчивостью и поэтому осуществляется переход к однорегистровым кодам ДКОИ (двоичный код об­мена информацией) или КОИ-8 (8-элементный код для обмена информацией).

При отсутствии избыточности (простой код) правило кодиро­вания не играет большой роли, так как для отображения знаков первичного алфавита используются все кодовые комбинации. Главное — код должен быть известен как отправителю, так и по­лучателю сообщения. 1 Один из способов кодирования следующий: все знаки первичного алфавита нумеруются в любом порядке, а затем эти десятичные числа представляются в двоичной системе счисления, при этом получается двоичный натуральный код.

Пример 1.2. Закодировать двоичным равномерным натуральным кодом сле­дующую последовательность чисел, выдаваемых датчиком: 2, 17, 36, 54, 0, 9.

[2]

Для кодирования необходимо десятичные числа перевести в двоичные н путем добавления нулей в старшие разряды добиться одинаковой значностн кодовых комбинаций (равномерный код). В данном примере n=6, так как для кодирования числа 54 требуется 6 двоичных разрядов. Искомая последова­тельность двоичных кодовых комбинаций будет иметь вид: 000010, 010001, 100100, 110110, 000000, 001001.

При наличии избыточности выбор используемых для кодиро­вания (разрешенных) кодовых комбинаций является основной и весьма трудной задачей. От этого зависит, сколько ошибок код может обнаружить и исправить. Более подробно корректирую­щие коды описаны в гл. 18.

Важным требованием к коду является техническая возмож­ность реализации операций кодирования и декодирования. Руч­ное кодирование в настоящее время применяется редко из-за ма­лой скорости и небольшой надежности. Один из примеров — код Морзе в телеграфной радиосвязи с приемом на слух. Коды дол­жны строиться так, чтобы можно было осуществить автомагиче­ские устройства кодирования и декодирования (кодеры и деко­деры). А их легче сделать для равномерных двоичных кодов.

Как стандартные электрические сигналы, соответствующие символам вторичного алфавита кода, обычно используются пря­моугольные импульсы напряжения или тока. На рис. 1.2 для дво­ичного кода символу 1 соответствует импульс положительной по­лярности, его называют «посылка», символу 0 — отсутствие им­пульса— «пауза». Иногда символу 0 соответствует импульс от­рицательной полярности —это будет двухуровневый, или двухпо-лярный первичный сигнал.

Длительности tu посылки и паузы обычно выбирают одинако­выми. Эта длительность зависит от требуемой скорости, передачи сообщений и характеристик канала связи. Число стандартных импульсов, передаваемых в 1 с,

В=1/tи (1.2)

называется скоростью модуляции. За единицу скорости принят «бод» — скорость, соответствующая передаче одного импульса в секунду. В современных системах передачи дискретных сообще­ний скорость модуляции принимает значения от десятков бод (буквопечатающая телеграфия) до сотен миллионов бод (цифро­вое телевидение).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: