Название приставки Сокращение приставки Значение приставки. Теперь основы для противоречий больше нет

киби Ки 2¹⁰=1024

меби Ми 2²⁰= 1048 576

гиби Ги 2³⁰= 1 073 741 824

теби Ти 2⁴⁰ = 1 099 511 627 776

пеби Пи 2⁵⁰ = 1 125 899 906 842 624

Теперь основы для противоречий больше нет. Двоичные приставки получили свои собственные названия и обозначения. Один кибибайт данных (КиБ) содержит 1024 байт. Два гибибайта оперативной памяти (2ГиБ) — это 2 147 483 648 байт. Но все-таки говорить об успешном решении проблемы еще рано. У новых правил МЭК есть один, но очень большой недостаток: никто не спешит их выполнять. Мешают многолетняя привычка и традиции языка. Уж очень неудобно и непривычно для многих пользователей звучат эти «кибибиты» и «мебибайты».

На своих учебных занятиях, где двоичное значение приставки не ясно из контекста задачи, обычно дается специальный комментарий или добавляем прилагательное «двоичный». При этом часть условия может звучать примерно так: «объем данных составляет тридцать два двоичных килобайта». С одной стороны, студенты сразу понимают, какую приставку использовать при вычислении. С другой стороны, здесь нет слишком грубого нарушения правил системы СИ.

1.6 Кодировка текстовых данных

Кодировка текстовых данных. Если каждому символу алфавита соотнести определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восемь двоичных разрядов достаточно для кодировки 256 разных символов. Этого хватит, чтобы представить разными комбинациями восьми битов все символы английского и российского языков, как маленькие, так и большие, а также знаки препинаний, символы основных арифметических действий и некоторые общепринятые специальные символы, например, символ "§".

Технически это выглядит очень просто, однако всегда существовали определенные весомые организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время, напротив, с большим количеством одновременно действующих стандартов. Для того, чтобы весь мир одинаково кодировал текстовые данные, нужные единственные таблицы кодировки, а это пока невозможно через противоречие между символами национальных алфавитов, а также через противоречие корпоративного характера.

Для английского языка, который захватил де-факто нишу международного средства общения, противоречия уже снятые. Институт стандартизации США (ANSI -american National Standard Institute) ввел в действие систему кодировки ASCII (American Standard Code for Information Interchange - стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодировки - базовая и расширенная. Базовая таблица закрепляет значение кодов от 0 до 127, а расширенная относится к символам представления номерами от 128 до 255.

Первых 32 кодов базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). На этом участке размещаются так называемые управляющие коды, которым не отвечают никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на печать, ими можно управлять лишь тем, как проводится вывод других данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинаний, цифр, арифметических действий и некоторых вспомогательных символов.

Таблица 1.6 – Некоторые значения кода ASCII (шестнадцатиразрядного)

Цифры	Русский алфавит	Английский алфавит
		А	00С0	а	00Е0	A
		Б	00С1	б	00Е1	B
		В	00С2	в	00Е2	C
		Г	00С3	г	00Е3	D
		Д	00С4	д	00Е4	E
		Е	00С5	е	00Е5	F
		Ё	00С6	ё	00Е6	G
		И	00С7	и	00Е7	H
		К	00СА	к	00ЕА	I
		Л	00СВ	л	00ЕВ	J	004A

Для кодировки символов русского языка используется система кодировки, известная как система кодировки Windows-1251, которая была введена "извне" компанией Microsoft, но, учитывая широкое распространение операционных систем и других программных продуктов этой компании в России, она глубоко закрепилась и нашла широкое приложение. Эта кодировка используется на большинстве локальных компьютеров, которые работают на платформе Windows.

Распространенной является кодировка, что носит название KОИ-8-R (код обмена информацией, восьмизначный), - его происхождение относится до времен действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета, для Украины используется кодировка KОИ-8-U.

Международный стандарт, в котором предусмотрена кодировка символов российского алфавита, носит название кодировки ISO (International Standard Organization - Международный институт стандартизации). На практике даная кодировка используется редко.

Универсальная система кодировки текстовых данных. Если проанализировать организационные трудности, связанные с созданием единственной системы кодировки текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного большим. Такая система, основанная на 16-разрядной кодировке символов, имеет название универсальной - UNICODE. Шестнадцать разрядов позволяют обеспечить уникальных кодов для 65 536 разных символов - этого поля достаточно для размещения в одной таблице символов большинства словно планеты.

Таблица 1.7 – Некоторые значения кода UNICODE