Наложение символов

ASCII

Материал из Википедии — свободной энциклопедии

Http://ru.wikipedia.org/wiki/ASCII

ASCII (англ. American Standard Code for Information Interchange — американский стандартный код для обмена информацией; по-американски произносится [ э́ски ], тогда как в Великобритании чаще произносится [ а́ски ]; по-русски также произносится [ а́ски ]) — 7‑битная компьютерная кодировка для представления латинского алфавита, десятичных цифр, некоторых знаков препинания, арифметических операций и управляющих символов. ^[1]

Содержание

1 Наложение символов
2 Национальные варианты ASCII
3 Кодировка
4 Управляющие символы
5 Структурные свойства таблицы
6 Представление ASCII в компьютерах
7 Примечание
8 См. также
9 Ссылки

Наложение символов

Благодаря символу BS (возврат на шаг) на принтере можно печатать один символ поверх другого. В ASCII было предусмотрено добавление таким образом диакритики к буквам, например:

a BS ' → á
a BS ` → à
a BS ^ → â
o BS / → ø
c BS, → ç
n BS ~ → ñ

(в старых шрифтах апостроф ' рисовался с наклоном вправо, а тильда ~ была сдвинута вверх, так что они как раз подходили на роль акута и тильды сверху).

Если на символ накладывается тот же символ, то получается эффект жирного шрифта, а если на символ накладывается подчёркивание, то получается подчёркнутый текст.

a BS a → a
a BS _ → a

(это используется, например, в справочной системе man).

Национальные варианты ASCII

Стандарт ISO 646 (ECMA-6) предусматривает возможность размещения национальных символов на месте @ [ \ ] ^ ` { | } ~. В дополнение к этому, на месте # может быть размещён £, а на месте $ — ¤. Такая система хорошо подходит для европейских языков, где нужны лишь несколько дополнительных символов. Вариант ASCII без национальных символов называется US-ASCII, или «International Reference Version».

Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO (Shift Out) и SI (Shift In) — в этом случае в национальном варианте можно полностью устранить латинские буквы и занять всё пространство под свои символы. См. также КОИ-7.

Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — разные другие нужные символы. В Юникоде первые 128 символов тоже совпадают с соответствующими символами US-ASCII.

Верхняя половина таблицы в настоящее время активно используется для представления кириллических символов и её вариации (КОИ-8, Windows-1251 и другие) доставляют основные проблемы с кодировками.

1 2 3 4 5

Подборка статей по вашей теме: