Кодирование текстовой информации

Кроме числовой информации в компьютере может обрабаты­ваться и текстовая информация, содержащая буквы, цифры, зна­ки препинания и другие символы. Обычно число различных сим­волов не превышает 256, поэтому для представления символов в компьютере используют восьмиразрядные двоичные коды (бай­ты). Существуют различные системы кодирования текстовой ин­формации – коды КОИ8, ДКОИ, ASCII. В компьютерах IBM PC используется код ASCII. Код символа в нем занимает восемь разрядов. Стандарт IOSO предусматривает несколько модификаций кода ASCII в зависимости от национального алфавита. Кодирова­ние символов в одной из модификаций кода ASCII показано в табл. 2.3.

В настоящее время получает развитие 16-разрядный код Unicode, который позволяет одновременно закодировать все буквы всех известных языков. Для букв русского языка в нем предусмотрены коды 1040... 1093. Впервые Unicode использовался в Windows NT.

Таблица 2.3. Кодирование символов в коде ASCII


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: