Лабораторная работа №11
Тема: Символьные данные и строки. Функции для работы со строками.
Цель работы: изучить принципы работы со строками и указателями на строки, алгоритмы решения задач на обработку строковых данных, научиться приемам решения задач на обработку строк, используя, функции для работы со строками и указателями на строки в языке С.
Теоретическая часть
Строковая константа представляется последовательностью символов кода ASCII, заключённой в кавычки: "...". Она имеет тип char[].
Примеры:
"This is character string"
"Это строковая константа"
"A" "1234567890" "0" "$"
В конце каждой строки компилятор помещает нулевой символ ' \0 ', отмечающий конец данной строки.
Каждая строковая константа, даже если она идентична другой строковой константе, сохраняется в отдельном месте памяти.
Если необходимо ввести в строку символ кавычек ("), то перед ним надо поставить символ обратной косой (\). В строку могут быть введены любые специальные символьные константы, перед которыми стоит символ \.
|
|
Символ \ и следующий за ним символ новой строки игнорируется.
Строковые константы размещаются в статической памяти. Вся фраза в кавычках является указателем на место в памяти, где записана строка. Это аналогично использованию имени массива, служащего указателем на расположение массива. Если это действительно так, то как выглядит оператор, который выводит строку?
/* Строки в качестве указателей */
main()
{
printf("%s, %u, %c\n", "We", "love", *"Pascal");
}
Итак, формат %s выводит строку We. Формат %u выводит целое без знака. Если слово "love" является указателем, то выдается его значение, являющееся адресом первого символа строки. Наконец, *"Pascal" должно выдать значение, на которое ссылается адрес, т.е. первый символ строки "Pascal".
Вот что выдаст наша программа:
We, 34, P
Для представления текстовой информации в языке С используются символы (константы), символьные переменные и строки (строковые константы), для которых в языке С не введено отдельного типа в отличие от некоторых других языков программирования.
Для символьных данных в С введен тип char. Описание символьных переменных:
char список_имен_переменных;
Например:
const char c='c';
//символ – занимает один байт, его значение не меняется
char a,b;
/*символьные переменные, занимают по одному байту,
значения меняются*/
const char *s="Пример строки\n";
//текстовая константа
Строка – это последовательность символов, заключенная в двойные кавычки (" ").
Размещая строку в памяти, транслятор автоматически добавляет в ее конце символ '\0' (нулевой символ или нулевой байт, который является признаком конца строки). В записи строки может быть и один символ: "А" (заключен в двойные кавычки), однако, в отличие от символьной константы 'А' (используются апострофы), длина строки "А" равна 2 байтам.
|
|
В языке С++ строка – это пронумерованная последовательность символов (массив символов), она всегда имеет тип char[]. Все символы строки нумеруются, начиная с нуля. Символ конца строки также нумеруется – ему соответствует наибольший из номеров. Таким образом, строка считывается значением типа "массив символов". Количество элементов в таком массиве на 1 больше, чем изображение соответствующей строки, так как в конец строки добавлен нулевой символ '\0' (рис. 11.1).
Рис. 11. 1. Представление строки и символа
Символьная строка в программном коде может располагаться на нескольких строках. Для переноса используется символ '\' с последующим нажатием клавиши ввод. Символ '\' игнорируется компилятором, и следующая строка считается продолжением предыдущей.
Присвоить значение строке с помощью оператора присваивания нельзя, так как для массивов не определена операция прямого присваивания. Поместить строку в символьный массив можно либо при вводе, либо с помощью инициализации:
char s1[] = "ABCDEF"; //инициализация строки
char s2[]={'A','B','C','D','E','F','\0'};//инициализация строки
При определении массива символьных строк необходимо сообщить компилятору требуемый размер памяти. Один из способов сделать это - инициализировать массив при помощи строковой константы. Например, оператор
char m1[ ]="Только ограничьтесь одной строкой.";
инициализировал внешний по умолчанию массив m1 для указанной строки. Этот вид инициализации является краткой формой стандартной инициализации массива
char m1[ ]={
'T','o','л','ь','k','o','
','o','г'','p','a','н','и','ч','ь','т','e','c','ь','
'o','д','н','o','й','
','c','т','p','o','k','o','й','.','\0'
}
Без символа 0 мы имеем массив символов, а не строку. Для той и другой формы компилятор подсчитывает символы и таким образом получает размер памяти. Как и для других массивов, имя m1 является указателем на первый элемент массива:
m1 == &m1[0], *m1 == 'T', и *(m1+1) == m1[1] == 'o'
и т.д.
Действительно, мы можем использовать указатель для создания строки. Например:
char *m3="\n Символьная строка.";
Это почти то же самое, что и
static char m3[ ]="\n Символьная строка.";
Оба описания говорят об одном: m3 является указателем строки со словами "Символьная строка". В том и другом случае сама строка определяет размер памяти, необходимой для ее размещения. Однако вид их не идентичен.