Дискретное сообщение, формируемое источником (отправителем), представляет собой последовательность знаков1, выбираемых из определенного набора. Например, перед отправкой телеграммы (сообщение) человек составляет ее текст, употребляя при этом буквы и символы из набора (алфавита), известного ему и получателю. Счетчик расхода ленты магнитофона выдает сведения в виде десятичного числа. Набор знаков, из которых формируется сообщение, называется первичным алфавитом или алфавитом сообщения. Количество знаков в этом алфавите Ма бывает различным, но обычно достаточно большим. Так, в русском языке для сообщения в виде текста используется набор из 33 букв, 10 цифр, более 15 различных условных знаков (пробел, точка, запятая, сложение, вычитание, умножение и т. д.). В некоторых других языках, особенно восточных, набор знаков первичного алфавита еще больше.
Для преобразования последовательности знаков дискретного сообщения в первичный сигнал сначала производится их кодирование, т. е. каждый знак сообщения акзаменяется комбинацией из небольшого числа стандартных символов, а далее эти стандартные символы преобразуются в стандартные электрические сигналы u1 (рис. 1.2). Необходимость перехода в электросвязи к изображению знаков первичного алфавита небольшим числом стандартных сигналов связано с тем, что из-за действия помех в приемнике легче принимать небольшое число сигналов.
|
|
Количество стандартных символов, с помощью которых про-изводится отображение знаков сообщения, называется вторичным алфавитом, или основанием кода. Процесс перехода от первичного сообщения к его вторичному отображению называется кодированием, а правило, по которому осуществляется такой пе-ход, называется кодом. Таким образом, код — алгоритм (пра-вило) перехода от первичного алфавита ко вторичному.
В результате кодирования каждый знак сообщения представ-ляется в виде последовательности символов вторичного алфавита —кодовых комбинаций.
Рис. 1.2 Преобразование сообщений при кодировании[1]
Характерным примером кода для передачи буквенно-цифровых текстов является код Морю. В этом коде в качестве символов используются точки, паузы разной длительности, тире. В двоичном коде, например Бодо, используются лишь два различных символа, обозначаемых как 0 и 1.
Кодирование может осуществляться вручную или автоматически. Устройство, осуществляющее операцию кодирования автоматически, называют кодером. Обратная операция, т. е. восстановление знаков сообщения из кодовых комбинаций, называется декодированием, а устройство, выполняющее эту операцию — декодером. Обычно кодер и декодер выполняют также операции преобразования символов в первичный сигнал и первичного сигнала в символы. Часто кодер и декодер объединяются в единое устройство — кодек.
|
|
Основными параметрами любого кода являются: первичный алфавит или алфавит сообщения Ма — число знаков сообщения, которое необходимо закодировать; вторичный алфавит, или основание кода m — число символов, с помощью которых производится кодирование, отличающихся друг от друга по каким-либо физическим признакам; значность или разрядность кода n — число символов вторичного алфавита в кодовой комбинации.
Коды могут быть заданы различными способами. Простейший и самый распространенный из них — табличный. При этом код имеет вид таблицы из двух колонок, в одной из которых размещены знаки первичного алфавита, а в другой — соответствующие им кодовые комбинации вторичного. В табл. П.1 приведены используемые в настоящее время коды для телеграфной передачи текста — код Морзе и МТК-2 (Международный телеграфный код № 2, доработанный с учетом особенностей русского языка). Следует отметить, что в литературе часто любой пятиразрядный код (n=5) называют кодом Бодо, в честь французского изобретателя Ж. Бодо, который в 1877 году создал первую практически пригодную систему последовательного телеграфирования на основе пятиразрядного кода. Однако код Бодо и МТК-2 отличаются таблицей соответствия знаков и кодовых комбинаций. В некоторых случаях код задают в виде графика, который дает более наглядное представление о кодовых комбинациях.
Классификация кодов. В зависимости от параметров различают следующие основные группы кодов.
Равномерные, все кодовые комбинации которых состоят из одинакового числа символов (n=const). Код Бодо, МТК-2 — равномерные коды. Для равномерного кода общее число кодовых комбинаций при заданных основании m и значности n
М0=mn (1.1)
Неравномерные, имеющие разное число символов в кодовых комбинациях,(n¹const). Примером неравномерного кода являетcz
код Морзе.
Простые, или коды без избыточности, в которых для отображения первичного алфавита используются все кодовые комбинации (Ма=Мо).
Корректирующие коды, или коды с избыточностью, в которых используются не все кодовые комбинации (Ма<М0). Наличие неиспользуемых (избыточных) кодовых комбинаций является необходимым условием для построения корректирующих кодов, позволяющих при декодировании обнаруживать и исправлять ошибки.
Двоичные коды, кодовые комбинации которых представляют собой сочетания из двух различных элементов 1 и 0.
Многопозиционные (недвоичные) коды имеют основание кода m>2.
В настоящее время в технике связи и при обработке информации на ЭВМ особое значение имеют двоичные коды. Это связано с простотой технической реализации как кодов, так и каналов связи для них.
Пример 1.1. Определить число кодовых комбинаций кода Бодо. Пригоден ли этот код для непосредственной передачи русского текста (букв, цифр, знаков препинания)?
Код Бодо является двоичным (m = 2), пятиразрядным (n=5) и согласно (1.1) M0 = 25 = 32. Поскольку русский текст содержит около 50 различных знаков первичного алфавита (Ма»50), код Бодо не может быть непосредственно использован для передачи русского текста, так как Ма>Мо.
Примечание. Однако пятиразрядный код уже более 100 лет используется в телеграфных аппаратах. Для этого введена так называемая система регистров, суть которой в том, что одни и те же кодовые комбинации используются для отображения двух и даже трех знаков первичного алфавита. Например, в МТК-2 комбинация 11010 означает букву Й и цифру 8, и ее смысл определяется тем, какая перед этим была последняя регистровая кодовая комбинация. Так, если комбинация 11010 следует после комбинации 11011, она означает цифру 8, а если после комбинации 00000 — русскую букву Й. Однако такая регистровая система обладает низкой помехоустойчивостью и поэтому осуществляется переход к однорегистровым кодам ДКОИ (двоичный код обмена информацией) или КОИ-8 (8-элементный код для обмена информацией).
|
|
При отсутствии избыточности (простой код) правило кодирования не играет большой роли, так как для отображения знаков первичного алфавита используются все кодовые комбинации. Главное — код должен быть известен как отправителю, так и получателю сообщения. 1 Один из способов кодирования следующий: все знаки первичного алфавита нумеруются в любом порядке, а затем эти десятичные числа представляются в двоичной системе счисления, при этом получается двоичный натуральный код.
Пример 1.2. Закодировать двоичным равномерным натуральным кодом следующую последовательность чисел, выдаваемых датчиком: 2, 17, 36, 54, 0, 9.
[2]
Для кодирования необходимо десятичные числа перевести в двоичные н путем добавления нулей в старшие разряды добиться одинаковой значностн кодовых комбинаций (равномерный код). В данном примере n=6, так как для кодирования числа 54 требуется 6 двоичных разрядов. Искомая последовательность двоичных кодовых комбинаций будет иметь вид: 000010, 010001, 100100, 110110, 000000, 001001.
При наличии избыточности выбор используемых для кодирования (разрешенных) кодовых комбинаций является основной и весьма трудной задачей. От этого зависит, сколько ошибок код может обнаружить и исправить. Более подробно корректирующие коды описаны в гл. 18.
Важным требованием к коду является техническая возможность реализации операций кодирования и декодирования. Ручное кодирование в настоящее время применяется редко из-за малой скорости и небольшой надежности. Один из примеров — код Морзе в телеграфной радиосвязи с приемом на слух. Коды должны строиться так, чтобы можно было осуществить автомагические устройства кодирования и декодирования (кодеры и декодеры). А их легче сделать для равномерных двоичных кодов.
|
|
Как стандартные электрические сигналы, соответствующие символам вторичного алфавита кода, обычно используются прямоугольные импульсы напряжения или тока. На рис. 1.2 для двоичного кода символу 1 соответствует импульс положительной полярности, его называют «посылка», символу 0 — отсутствие импульса— «пауза». Иногда символу 0 соответствует импульс отрицательной полярности —это будет двухуровневый, или двухпо-лярный первичный сигнал.
Длительности tu посылки и паузы обычно выбирают одинаковыми. Эта длительность зависит от требуемой скорости, передачи сообщений и характеристик канала связи. Число стандартных импульсов, передаваемых в 1 с,
В=1/tи (1.2)
называется скоростью модуляции. За единицу скорости принят «бод» — скорость, соответствующая передаче одного импульса в секунду. В современных системах передачи дискретных сообщений скорость модуляции принимает значения от десятков бод (буквопечатающая телеграфия) до сотен миллионов бод (цифровое телевидение).