double arrow

Формы представления информации в ЭВМ


Кодирование информации – это процесс формирования определенного представления информации.

В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения. Передачи или обработки.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т.д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например «наложить» друг на друга звуки от разных источников.

Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.




Как правило, все числа в компьютере представляются с помощью нулей и единиц. Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

Почему информация представляется именно в виде нулей и единиц?

Электронная схема ПК состоит из элементов, каждое из которых может находиться только в двух состояниях: (есть ток – нет тока, открыт – закрыт, намагничен – не намагничен). Каждое из пары таких состояний принято обозначать цифрами 0 и 1, которые называются битами (двоичная система). 1 байт =8 битам, воспринимается компьютером как единое целое.

Для того, чтобы информацию сохранить, ее надо закодировать. Закодировать можно любую информацию (числовую, текстовую, звуковую и графическую). Длиной кода называется количество знаков, используемых для представления кодируемой информации.

1 байт = 8 битам. 28=256.

Всеобщая договоренность между людьми мира об одинаковом использовании чего-либо называется стандартом. Стандарт устанавливает таблицу, в которой записано, каким кодом должен кодироваться каждый символ. Такая таблица называется таблицей кодов. Но проблема в том, что символы одни не подходят к другим странам. Поэтому было принято решение таблицу кодов разделить пополам. Первые 128 кодов (с 0 до 127) должны быть стандартными и обязательными для всех стран мира и всех компьютеров, а во второй половине (с кода 128 до кода 255) каждая страна может делать все, создавать свой стандарт – национальный. Первую половину таблицы кодов называют таблицей ASCII – ее ввел американский институт стандартизации. В этой таблице размещаются прописные и строчные буквы английского языка, символы чисел от 0 до 9, все знаки препинания, символы арифметических операций и некоторые другие специальные коды. Стандарт ASCII первые 32 кода (от 0 до 31) не определяет, он оставляет их для так называемых управляющих кодов, применяются для управления компьютером.



Код 32 – пробел

Код 48 – 57 – десять цифр (от 0 до 9)

58-64 - математические символы и знаки препинания

65-90 - прописные английские буквы от А до Z

97-122 - строчные буквы английских алфавита

123-127 – специальные символы

В современных ПК используется таблица Unicode – 16-битовая, 216=65536 различных символов.







Сейчас читают про: