Кодирование и декодирование

Дискретное сообщение, формируемое источником (отправителем), представляет собой последовательность знаков¹, выбираемых из определенного набора. Например, перед отправкой телеграммы (сообщение) человек составляет ее текст, употребляя при этом буквы и символы из набора (алфавита), известного ему и получателю. Счетчик расхода ленты магнитофона выдает сведения в виде десятичного числа. Набор знаков, из которых формируется сообщение, называется первичным алфавитом или алфавитом сообщения. Количество знаков в этом алфавите М_а бывает различным, но обычно достаточно большим. Так, в русском языке для сообщения в виде текста используется набор из 33 букв, 10 цифр, более 15 различных условных знаков (пробел, точка, запятая, сложение, вычитание, умножение и т. д.). В некоторых других языках, особенно восточных, набор знаков первичного алфавита еще больше.

Для преобразования последовательности знаков дискретного сообщения в первичный сигнал сначала производится их кодирование, т. е. каждый знак сообщения а_кзаменяется комбинацией из небольшого числа стандартных символов, а далее эти стандартные символы преобразуются в стандартные электрические сигналы u₁(рис. 1.2). Необходимость перехода в электросвязи к изображению знаков первичного алфавита небольшим числом стандартных сигналов связано с тем, что из-за действия помех в приемнике легче принимать небольшое число сигналов.

Количество стандартных символов, с помощью которых про-изводится отображение знаков сообщения, называется вторичным алфавитом, или основанием кода. Процесс перехода от первичного сообщения к его вторичному отображению называется кодированием, а правило, по которому осуществляется такой пе-ход, называется кодом. Таким образом, код — алгоритм (пра-вило) перехода от первичного алфавита ко вторичному.

В результате кодирования каждый знак сообщения представ-ляется в виде последовательности символов вторичного алфавита —кодовых комбинаций.

Рис. 1.2 Преобразование сообщений при кодировании[1]

Характерным примером кода для передачи буквенно-цифровых текстов является код Морю. В этом коде в качестве символов используются точки, паузы разной длительности, тире. В двоичном коде, например Бодо, используются лишь два различных символа, обозначаемых как 0 и 1.

Кодирование может осуществляться вручную или автоматически. Устройство, осуществляющее операцию кодирования автоматически, называют кодером. Обратная операция, т. е. восстановление знаков сообщения из кодовых комбинаций, называется декодированием, а устройство, выполняющее эту операцию — декодером. Обычно кодер и декодер выполняют также операции преобразования символов в первичный сигнал и первичного сигнала в символы. Часто кодер и декодер объединяются в единое устройство — кодек.

Основными параметрами любого кода являются: первичный алфавит или алфавит сообщения М_а — число знаков сообщения, которое необходимо закодировать; вторичный алфавит, или основание кода m — число символов, с помощью которых производится кодирование, отличающихся друг от друга по каким-либо физическим признакам; значность или разрядность кода n — число символов вторичного алфавита в кодовой комбинации.

Коды могут быть заданы различными способами. Простейший и самый распространенный из них — табличный. При этом код имеет вид таблицы из двух колонок, в одной из которых размещены знаки первичного алфавита, а в другой — соответствующие им кодовые комбинации вторичного. В табл. П.1 приведены используемые в настоящее время коды для телеграфной передачи текста — код Морзе и МТК-2 (Международный телеграфный код № 2, доработанный с учетом особенностей русского языка). Следует отметить, что в литературе часто любой пятиразрядный код (n=5) называют кодом Бодо, в честь французского изобретателя Ж. Бодо, который в 1877 году создал первую практически пригодную систему последовательного телеграфирования на основе пятиразрядного кода. Однако код Бодо и МТК-2 отличаются таблицей соответствия знаков и кодовых комбинаций. В некоторых случаях код задают в виде графика, который дает более наглядное представление о кодовых комбинациях.

Классификация кодов. В зависимости от параметров различают следующие основные группы кодов.

Равномерные, все кодовые комбинации которых состоят из одинакового числа символов (n=const). Код Бодо, МТК-2 — равномерные коды. Для равномерного кода общее число кодовых комбинаций при заданных основании m и значности n

М₀=mⁿ (1.1)

Неравномерные, имеющие разное число символов в кодовых комбинациях,(n¹const). Примером неравномерного кода являетcz

код Морзе.

Простые, или коды без избыточности, в которых для отображения первичного алфавита используются все кодовые комбинации (М_а=Мо).

Корректирующие коды, или коды с избыточностью, в которых используются не все кодовые комбинации (М_а<М₀). Наличие неиспользуемых (избыточных) кодовых комбинаций является необходимым условием для построения корректирующих кодов, позволяющих при декодировании обнаруживать и исправлять ошибки.

Двоичные коды, кодовые комбинации которых представляют собой сочетания из двух различных элементов 1 и 0.

Многопозиционные (недвоичные) коды имеют основание кода m>2.

В настоящее время в технике связи и при обработке информации на ЭВМ особое значение имеют двоичные коды. Это связано с простотой технической реализации как кодов, так и каналов связи для них.

Пример 1.1. Определить число кодовых комбинаций кода Бодо. Пригоден ли этот код для непосредственной передачи русского текста (букв, цифр, знаков препинания)?

Код Бодо является двоичным (m = 2), пятиразрядным (n=5) и согласно (1.1) M₀ = 2⁵ = 32. Поскольку русский текст содержит около 50 различных знаков первичного алфавита (М_а»50), код Бодо не может быть непосредственно использован для передачи русского текста, так как М_а>Мо.

Примечание. Однако пятиразрядный код уже более 100 лет используется в телеграфных аппаратах. Для этого введена так называемая система регистров, суть которой в том, что одни и те же кодовые комбинации используются для отображения двух и даже трех знаков первичного алфавита. Например, в МТК-2 комбинация 11010 означает букву Й и цифру 8, и ее смысл определяется тем, какая перед этим была последняя регистровая кодовая комбинация. Так, если комбинация 11010 следует после комбинации 11011, она означает цифру 8, а если после комбинации 00000 — русскую букву Й. Однако такая регистровая система обладает низкой помехоустойчивостью и поэтому осуществляется переход к однорегистровым кодам ДКОИ (двоичный код обмена информацией) или КОИ-8 (8-элементный код для обмена информацией).

При отсутствии избыточности (простой код) правило кодирования не играет большой роли, так как для отображения знаков первичного алфавита используются все кодовые комбинации. Главное — код должен быть известен как отправителю, так и получателю сообщения. ¹ Один из способов кодирования следующий: все знаки первичного алфавита нумеруются в любом порядке, а затем эти десятичные числа представляются в двоичной системе счисления, при этом получается двоичный натуральный код.

Пример 1.2. Закодировать двоичным равномерным натуральным кодом следующую последовательность чисел, выдаваемых датчиком: 2, 17, 36, 54, 0, 9.

[2]

Для кодирования необходимо десятичные числа перевести в двоичные н путем добавления нулей в старшие разряды добиться одинаковой значностн кодовых комбинаций (равномерный код). В данном примере n=6, так как для кодирования числа 54 требуется 6 двоичных разрядов. Искомая последовательность двоичных кодовых комбинаций будет иметь вид: 000010, 010001, 100100, 110110, 000000, 001001.

При наличии избыточности выбор используемых для кодирования (разрешенных) кодовых комбинаций является основной и весьма трудной задачей. От этого зависит, сколько ошибок код может обнаружить и исправить. Более подробно корректирующие коды описаны в гл. 18.

Важным требованием к коду является техническая возможность реализации операций кодирования и декодирования. Ручное кодирование в настоящее время применяется редко из-за малой скорости и небольшой надежности. Один из примеров — код Морзе в телеграфной радиосвязи с приемом на слух. Коды должны строиться так, чтобы можно было осуществить автомагические устройства кодирования и декодирования (кодеры и декодеры). А их легче сделать для равномерных двоичных кодов.

Как стандартные электрические сигналы, соответствующие символам вторичного алфавита кода, обычно используются прямоугольные импульсы напряжения или тока. На рис. 1.2 для двоичного кода символу 1 соответствует импульс положительной полярности, его называют «посылка», символу 0 — отсутствие импульса— «пауза». Иногда символу 0 соответствует импульс отрицательной полярности —это будет двухуровневый, или двухпо-лярный первичный сигнал.

Длительности t_u посылки и паузы обычно выбирают одинаковыми. Эта длительность зависит от требуемой скорости, передачи сообщений и характеристик канала связи. Число стандартных импульсов, передаваемых в 1 с,

В=1/t_и(1.2)

называется скоростью модуляции. За единицу скорости принят «бод» — скорость, соответствующая передаче одного импульса в секунду. В современных системах передачи дискретных сообщений скорость модуляции принимает значения от десятков бод (буквопечатающая телеграфия) до сотен миллионов бод (цифровое телевидение).

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

1 2 3 4 5 6 7

Основные экономические группировки стран современного мира

РАВНОМЕРНЫЙ ПРОКАТ

ОБОЗНАЧЕНИЕ МАТЕРИАЛОВ НА ЧЕРТЕЖАХ

Требования к тексту документа

Константа химического равновесия

Типы организационных структур управления

Самый сильный аргумент, почему эволюция человека не могла быть