Представление и обработка текстовой информации в ПК

Текст – любая последовательность символов, к которым относятся буквы, пробел, знаки препинания, цифры, знаки арифметических операций и т. п. К аппаратным средствам компьютера для ввода текста относится клавиатура, световой карандаш со специальным планшетом, сканер и др. Основные средства для вывода текстовой информации: монитор и принтер.
К программным средствам, предназначенным для работы с текстами, относятся: электронные блокноты; текстовые редакторы; текстовые процессоры; редакционно-издательские системы; программы-переводчики; лингвистические корректоры; системы, осуществляющие интеллектуальный поиск и интеллектуальную обработку текстов, размещенных в сетях.

Текстовая информация хранится и обрабатывается в ЭВМ в двоичном коде. Средством кодирования служит таблица соответствия, устанавливающая взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем (байтами и символами).

Существует несколько видов специальных таблиц кодов. Наибольшеераспространение получили кодовые таблицы: ASCII (American Standard Code for Information Interchange – американский стандартный код обмена информацией), двоичный код обмена информацией (ДКОИ) и КОИ-8.

Обычно в России используется альтернативная кодировка, содержащая символы русского алфавита. Таковых насчитывается не менее четырёх. Все таблицы кодов содержат 256 символов (1 байт на символ).

При вводе в компьютер текстовых данных каждая буква кодируется определенным числом в соответствии с таблицей кодов. Это происходит следующим образом – при нажатии клавиши на клавиатуре компьютера с изображением символа осуществляется ввод в ЭВМ соответствующего знака алфавита. Таким образом, выполняется его кодирование, то есть преобразование знака в компьютерный (машинный) код. Для вывода на внешние устройства (экран или печать) по этим числам строятсяизображения букв, то есть при выводе знака на экран монитора или принтер происходит обратный процесс – декодирование. В этом случае знак из компьютерного кода преобразуется в графическое изображение..Кодирование используется при выполнении различных информационных процессов, при этом информация может неоднократно кодироваться, т.е. изменять своё представление. Простейшие примеры перекодировки – передача телеграмм или заказ билетов в автоматизированной системе. Конечно, кодирование широко используется в программировании и при проведении мероприятий по защите информации.



Представление числовой информации в ПК.

Для представления информации в памяти ЭВМ (как числовой, так и не числовой) используется двоичный способ кодирования. Элементарная ячейка памяти ЭВМ имеет длину 8 бит (байт). Каждый байт имеет свой номер (его называют адресом). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое, называют машинным словом. Длина машинного слова зависит от разрядности процессора и может быть равной 16, 32, 64 битам и т.д.

Один из способов представления целых чисел — дополнительный код. Диапазон значений величин зависит от количества бит памяти, отведенных для их хранения. Например, величины типа Integer лежат в диапазоне от
-32768 (-215) до 32767 (215-1) и для их хранения отводится 2 байта (16 бит); типа LongInt — в диапазоне от -231 до 231-1 и размещаются в 4 байтах (32 бита). Не стоит забывать, что нумерация бит в байте происходит справа налево. Прямой код целого числа может быть получен следующим образом: число переводится в двоичную систему счисления, а затем его двоичную запись слева дополняют таким количеством незначащих нулей, сколько требует тип данных, к которому принадлежит число.

Дополнительный код целого отрицательного числа может быть получен по следующему алгоритму:

1. записать прямой код модуля числа;

2. инвертировать его (заменить единицы нулями, нули — единицами);

3. прибавить к инверсному коду единицу.

Для записи действительных чисел применяется иной способ кодирования.

Здесь число записывается в виде M ×10 p число М называется мантисой, от количества знаков после запятой зависит точность записанного числа.

Мантиса обычно записывается в формате 0≤M<1.

Для примера тип Real принимает значения в диапазоне 2,9×10-39..1,7×1038, занимаемый объём равен 6 Байтам, а мантиса 11-12 знаков, а Double
диапазон 5,0×10-324..1,7×10308, занимает объём 8 Байт и имеет мантису 15-16 знаков.




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: