Кодирование символов и текстов

Для кодирование символов нужно выбрать некоторую кодовую таблицу. Она определяет множества допустимых символов и сопоставленные им целые коды.

Существует 7- битные, 8 – битные, 16 и 32 битные кодовые таблицы.

ASCII (7 бит) 8- битные таблицы…

Коды 0…127 (0…7F коды 128-255 (80..FF)

Одинаковые и используется для …. символов какого- либо

Соответствуют языка, т. е существует множество 8- битных

ASCII во всех современных кодовых таблиц. Часто по нескольку для

Кодировках. одного языка.

8 битные таблицы для русского языка.

1) ср. 1251 (windows- 1251)

2) KOI 8- R (пример: в Unix- системах)

3)ISO – 866 (ГОСТ - А, ранее применялось в OC DOS).

Текст представляется последовательностью символов и основное отличие в способах кодирования переноса строги. В Windows принята пора символов 1310, в UNIX с кодом 10.

Чтобы устранить различные кодовые таблицы, была введена 16- битная таблица UNOCODE. Которая на сегодняшний день является стандартной, рекомендованная для использования ….

Существует UNICODE 32 и UNICODE 62, которые решают проблему азиатских языков.

Д/З.: 1) Взять день и месяц рождения на 4-х значениях числа записать его в двоичной, троичной, восьмеричной и шестнадцатеричной системах. 2) Считая, что это число записанным в 16-ричной системе и записывать в 10-ричной. 3) Закодировать фамилию в ср. 1251, KOI 8- R и UNICODE.

Кодировки, основанные на кодовой таблице UNICODE:

1.Кодировки с постоянным числом бит на символ. (UCS 2- 2 байта на символ (внутри OC windows и в параметрах ее системных вызовов – с windows 2000 (win NT 5.0))).

В языках программирование, в которых есть тип данных для UNICODE- символов.

2. Кодировки с переменным числом бит на символах (UTF). В этих кодировках символом из диапазона 0…127 дает минимальное число байт, а остальным увеличенное. UTF- 8. Символы из диапазона 0…827 кодируется одним байтом, остальные 2- мя, 3- мя, 4- мя или 5-ю байтами. Кодировка была придумана для совместимости со старым ПО, который работает с однобайтными строками. Англоязычный текст выглядит так же, как в кодировках ASCII, конкретно работает поиск и алфавитное упорядочивание даже для многобайтных символов. Применяется в Internet.

UTF- 16 символы с диапазоном 0….32267 выделяется 2 байтами, остальные большее число байт. UTF- 16 находится в таком же отношении совместимости с UCS- 2, как UTF с ASCII.

В начале UNICODE- текста иногда добавляется 2 байта специально назначения. Они называются BOM- BITE ORDER MARK (памятка о порядке байт).

Прямой и обратный порядок байт.

Память любой современной ЭВМ можно представить себе как длинную ленту, состоящих из отдельных байт. У каждого байта есть адрес, начиная с О и т.д. Допустим, начиная с некоторого адреса в памяти размещено их байтное целое. Оно может размешаться двумя способами: 1) сначала старший байт, потом остальные до младшего – прямой порядок байт «тупоконечный» BE- Big Endean’s.

2) Сначала младший байт, потом остальные до старшего - обратный порядок байт «остроконечный» LE – Little Endean’s.

В архитектуре Intel (AMD) используется LE.

Кодировка цветов.

Любой цвет на экране получается из сочетании трех базисных: красного, зеленого, синего и желтого взятого в разном соответствии.

Стандартное программное представления – 3 байта на цвет, по 1 байту на R, G и B составляющие (RGB- формой).

FFFFFF – белый коды с одинаковым значением, OOOOOO – черный байт соответствуют градациям серого.

Иногда в графиках изображения нужна информация о прозрачности точки. Тогда добавляется 4-й байт степени прозрачности. Его называют альфа-каналом, а формат RGBA.

В полиграфии используется другие базовые цвета (CMYK).

Доклад: представление вещественных чисел.

В технике применяется не только двоичная система: троичная сбалансированная система счисления (каждый разряд может принимать одно из 3-х значений: 0,1; -1; достоинство: значимость - как информационное (в математике доказано, что лучше всего основание - самое экономичное, а ближе всего) и инженерное (мы можем использовать и потом, и отрицательный сигнал). Впервые была применена в ЭВМ «ступень» Брусенцовым. Удобно представлять отрицательные числа- не нужен дополнительный код. Модумерная арифметика: используется кодирование в остатках от деления на разных делители. В таком представлении арифметика машинная для операций сложнее и умножение выполняется на порядок быстрее. (в 10 и более раз).

Д\З: Закодировать фамилию в UTF- 8.

Информатика и информационные технологии.

Изначально ЭВМ были предназначены для вычисления. Отрасль состояла из инженерной практики создание ЭВМ и специальных разделов математики- теории алгоритмов и вычислительная математика. В это же время в 1946г. Появляется кибернетика. Такое название носит книга американского ученого НОРБЕРТА ВИННЕРА. Автор определял кибернетику как науку об управлении в биологический и теоретических системах. К этому времени уже существовали общие теории систем. (Текстология – всеобщая организационная наука А.А. Богданов; «теория систем» Бертолонфий). Винер тоже занимается системами в общем понимании, но акцентируется на механизмах управления и информационных процессах, на их общности в самых различных системах. Есть понимание общности этих процессов и есть универсальные вычислительные машины. Естественным шагом является идея применения этих машин для любых задач обработки информации. Эти идеи быстро распространились в научных средах в других странах. Предельной ценою кибернетика ставила искусственный интеллект (ИИ). Направление ИИ дало решение многих задач: распознавание образов, автоматическое управление техникой, обработка естественного языка.

Под эгиды кибернетики в разных странах началась автоматизация экономики, т. е ЭВМ стало применятся для обработки данных. В СССР начался проект ОГАС, который предполагал создание единой сети между всеми предприятиями и полной информатизации управления при сокращение бюрократии (Лужков). По политическим причинам проект был свернут до отдельных систем автоматизации (АСУ). Под влияние идеи Лужкова Стафорд Бир создал в Чили для правительства Альенде такую систему. Поскольку кибернетика распалась на много практических и теоретических наставлений, ее название используется в основном исторически. А с 70 – x годов распространился термин «информатика» и «информационные технологии».

Информатика- область науки, занимающаяся проблемами обработки данных.

Что можно делать с данными: хранить, преобразовывать и передавать.

При взаимодействии информационной системы с окружающим миром. Их можно рассматривать как передачу, но уж слишком они особый сбор данных и управление внешними объектами.

Пример сбора данных: использование датчиков в системе управления заводом. Пример управления: автоматически управлять техникой.

Информационные технологии (ИТ.)- применение тех. средств для решение задач информатики.

Тех. средства – аппаратные и программные системы.

В современной электронике, т. е на любом уровне, поэтому любая аппаратная система на самом деле программно-аппаратные.

ПО предназначению для работы в составе физического устройства называют вероятным ПО.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: