Кодирование графических данных. Кодирование текстовых данных

Кодирование текстовых данных

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 28=256 различных символов.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица кодировки

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.

Таблица кодировки ASCII.

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов (с 128 по 255) используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

Символ Двоичный код Символ Двоичный код Символ Двоичный код Символ Двоичный код
А   И   Р   Ш  
Б   Й   С   Щ  
В   К   Т   Ъ  
Г   Л   У   Ы  
Д   М   Ф   Ь  
Е   Н   Х   Э  
Ж   О   Ц   Ю  
З   П   Ч   Я  

Отсутствие стандартов в этой области привело к множественности одновременно действующих кодировок. Так, например, кодировка символов русского алфавита, известная как кодировка Windows-1251, была введена «извне» – компанией Microsoft, но учитывая широкое распространение операционных систем и других продуктов этой компании на постсоветском пространстве, она глубоко закрепилась и нашла широкое распространение.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ-7, КОИ-8, СР1251, СР866, Mac, ISO).

КОИ – код обмена информации семизначный (восьмизначный).

СР – Code Page (кодовая страница).

В настоящее время получил широкое распространение новый международный стандарт Unicode – универсальная система кодирования, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536) различных символов.

Если рассмотреть с помощью увеличительного стекла чёрно – белое изображение, напечатанное на бумаге, то можно увидеть, что оно состоит из мельчайших точек, образующий характерный узор, называемый растром.

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов.

Поскольку линейные координаты и индивидуальные свойства каждой точки (т.е. яркость) можно выразить с помощью целых чисел, то можно сказать, что растровое координирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление чёрно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа.

Для кодирования графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основные цвета:

- красный– (Red, R);

- зелёный – (Green, G);

- синий– (Blue, B);

На практике считается (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом, можно получить путём механического смешивания этих трёх основных цветов. Такая система называется RGB по первым буквам названий основного цвета.

Если для кодирования яркости каждой из основных составляющих соответствует 256 значений (восемь двоичных разрядов), как принято в полутоновых чёрно-белых изображений, то на кодирования цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение около 17 млн различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным режимом (True Color).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов. Соответственно дополнительными цветами являются:

- голубой (Cyan, C);

- пурпуровый (Magenta, M);

- жёлтый (Yellow, Y).

Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпуровой и жёлтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии используется ещё и четвёртая краска – чёрная (Black, B). Поэтому данная система кодирования обозначается четырьмя буквами CMYK (чёрный цвет обозначается буквой K потому, что буква B уже занята синим цветом), и для представления цветовой графики в этой системе координат надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным режимом (True Color).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объём данных, но при этом диапазон кодированных цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.

При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования называется индексным. Смысл названия в том, что поскольку 256 значений совершенно недостаточно, чтобы передать весь диапазон цветов, но достаточно, чтобы передать номер (индекс) цвета в некой справочной таблице называемой палитрой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: