Принцип последовательного кодирования алфавитов

Мая группа № 13 (Информатика и ИКТ)

Урок № 70

Тема программы: Работа с символьной информацией

Тема урока: Правила описания символьных величин и символьных строк. Основные функции и процедуры Паскаля для работы с символьной информацией

Цель: ввести понятия символьной информации, познакомиться с функциями и процедурами, предназначенными для работы с символьными величинами, научиться решать задачи с использованием символьной информации.

ПЛАН

1. Теоретический материал

1) Символьный тип данных

2) Строки символов

2. Вопросы и задания

Теоретический материал

Символьный тип данных

Величина типа «символ» может принимать значения любых символов компьютерного алфавита. Символьная величина занимает 1 байт памяти, в котором хранится код этого символа, соответствующий используемой кодовой таблице. Заметим, что в Delphi наряду с однобайтовой кодировкой символов используется и двухбайтовая.

Символьная константа записывается между апострофами. Например: 1R', ' + ', '9', 'j'.

Символьной тип называется Char. Пример описания символьных переменных:

Var c1, с2: Char;

Символьный тип относится к порядковым типам данных. Из этого следует:

• символы — упорядоченное множество;

• у каждого символа в этом множестве есть свой порядковый номер;

• между символами работает соотношение «следующий — предыдущий».

Порядковый номер символа — это его десятичный код, который лежит в диапазоне от 0 до 255. Например, в кодовой таблице ASCII десятичный код латинской буквы 'А' равен 65, а цифры '5' — 53. О стандартах кодирования символов рассказывалось на уроках 13 - 16 "Представление текста, изображения и звука в компьютере".

Функция Ord(x)

Ord(x) — функция от аргумента порядкового типа, которая возвращает порядковый номер значения х в этом типе данных. Если х — символьная величина, то результатом функции будет десятичный код х в кодовой таблице. Например:

Ord('А')= 65, Ord('5')= 53

Функция Chr (х)

Chr (х) — функция от целочисленного аргумента, результатом которой является символ с кодом, равным х. Например:

Chr(65)='A', Chr(53)='5'

Поскольку коды символов лежат в диапазоне от 0 до 255, желательно тип х определять либо как byte, либо как интервальный тип 0..255.

Пример 1. Составить программу на Паскале, по которой на экран будет выводиться таблица кодировки в диапазоне кодов от 32 до 255. Напомним, что символы с кодами, меньшими 32, являются управляющими (не экранными).

Значения выводятся парами: символ — код. В одной строке располагается 10 таких пар. Вся таблица разместится в 24 строках на экране.

Принцип последовательного кодирования алфавитов

В любой кодовой таблице выполняется принцип последовательного кодирования латинского (английского) алфавита и алфавита десятичной системы счисления. Это важное обстоятельство, которое часто учитывается в программах обработки символьной информации.

При выполнении операций отношений, применительно к символьным величинам, учитываются коды этих величин. Чем больше значение кода, тем символ считается больше. Истинными являются следующие отношения: 'А' с 'В', 'Z' > 'Y', 'а' > 'А'. Значение символьной переменной С является прописной (заглавной) латинской буквой, если истинно логическое выражение:

(С >= 'А') and (C <= 'Z')

Значение символьной переменной С является цифрой, если истинно логическое выражение:

(С >= ’0') and (С <= '9')

В латинском алфавите 26 букв. Поэтому разница между кодами букв 'Z' и 'А', а также 'z' и 'а' равна 25.

Пример 2. С помощью датчика случайных чисел заполнить массив Sim[0..10] строчными английскими буквами. Затем массив отсортировать в алфавитном порядке.

При тестировании программы было получено:

Исходный массив:

gnkbeqgmsin

Отсортированный массив:

beggikmnnqs

 

Вопросы и задания

1. Как в программе на Паскале обозначаются символьные константы и переменные?

2. Определите результаты вычисления выражений (типы и значения):

Строки символов

Рассмотрим еще один структурный тип данных — строковый тип. Строковый тип данных был введен в Турбо Паскале. Он позволяет программировать обработку слов, предложений, текстов.

Строка — это последовательность символов. Каждый символ занимает 1 байт памяти (код ASCII). Количество символов в строке называется ее длиной. Длина строки может находиться в диапазоне от 0 до 255. Строковые величины могут быть константами и переменными.

Строковая константа записывается как последовательность символов, заключенная в апострофы. Например:

' Язык программирования ПАСКАЛЬ'

' IBM PC - computer'

'33-45-12'

Строковая переменная описывается в разделе описания переменных следующим образом:

Var <идентификатор>: String[<максимальная длина строки>]

Например:

Var Name: String[20]

Параметр длины может и не указываться в описании. В таком случае подразумевается, что он равен максимальной величине — 255. Например:

Var slovo: String

Строковая переменная занимает в памяти на 1 байт больше, чем указанная в описании длина. Дело в том, что один (нулевой) байт содержит значение текущей длины строки. Если строковой переменной не присвоено никакого значения, то ее текущая длина равна нулю. По мере заполнения строки символами ее текущая длина возрастает, но она не должна превышать максимальной по описанию величины.

Символы внутри строки индексируются (нумеруются), начиная с единицы. Каждый отдельный символ идентифицируется именем строки с индексом, заключенным в квадратные скобки. Например:

Name[5], Name[i], slovo[k+1].

Значение индекса может быть задано положительной константой, переменной, выражением целочисленного типа. Оно не должно выходить за границы описания.

Тип String и стандартный тип Char совместимы: строки и символы могут употребляться в одних и тех же выражениях.

Строковые выражения строятся из строковых констант, переменных, функций и знаков операций. Над строковыми данными допустимы операция сцепления и операции отношения.

Операция сцепления (+) применяется для соединения нескольких строк в одну результирующую строку. Сцеплять можно как строковые константы, так и переменные.

Например:

'ЭВМ'+' 1ВМ'+' PC'

В результате получится строка:

'ЭВМ IBM PC'

Длина результирующей строки не должна превышать 255.

Операции отношения: =, <, >, <=, >=, < > производят сравнение двух строк, в результате чего получается логическая величина (true или false). Операции отношения имеют более низкий приоритет, чем операция сцепления. Сравнение строк производится слева направо до первого несовпадающего символа, и та строка считается больше, в которой первый несовпадающий символ имеет больший номер в таблице символьной кодировки.

Если строки имеют различную длину, но в общей части символы совпадают, считается, что более короткая строка меньше, чем более длинная. Строки равны, если они полностью совпадают по длине и содержат одни и те же символы.

Функции и процедуры

Функция Copy(S, Poz, N) выделяет из строки S подстроку длиной N символов, начиная с позиции Poz. N и Роz — целочисленные выражения.

Функция Concat (SI, S2,..., SN) выполняет сцепление (конкатенацию) строк S1,..., SN в одну строку.

Функция Length (S) определяет текущую длину строки S. Результат — значение целочисленного типа.

Функция Pos (SI, S2) обнаруживает первое появление в строке S2 подстроки S1. Результат — целое число, равное номеру позиции, где находится первый символ подстроки S1. Если в S2 не обнаружена подстрока S1, то результат равен 0.

Процедура Delete (S, Poz, N) удаляет N символов из строки S, начиная с позиции Poz.

В результате выполнения процедуры уменьшается текущая длина строки в переменной S.

Процедура Insert (SI, S2, Poz) выполняет вставку строки S1 в строку S2, начиная с позиции Poz.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: