Решение задач на кодирование текстовой информации

Что нужно знать:

Ÿ все символы кодируются одинаковым числом бит (алфавитный подход)

Ÿ чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)

Ÿ при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта

Ÿ после знака препинания внутри (не в конце!) текста ставится пробел

Ÿ чтобы найти информационный объем текста I, нужно умножить количество символов Kна информационный вес одного символа a: I=K*a

Пример 1. Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени нагури, алфавит которого состоит из 16 символов. Чей текст несет большее количество информации?

Решение:
I = К * а (информационный объем текста равен произведению числа символов на информационный вес одного символа).
Т.к. оба текста имеют одинаковое число символов (К), то разница зависит от информативности одного символа алфавита (а).
2а1 = 32, т.е. а1 = 5 бит,

2а2 = 16, т.е. а2 = 4 бит.

I1 = К * 5 бит, I2 = К * 4 бит.

Ответ: текст, записанный на русском языке в 5/4 раза несет больше информации.

Пример 2. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мб. Определить мощность алфавита.

Решение.
I = 1/512 * 1024 * 1024 * 8 = 16384 бит – перевели в биты информационный объем сообщения.

а = I / К = 16384 /2048 =8 бит – приходится на один символ алфавита.
28 = 256 символов - мощность использованного алфавита.

Пример 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?

Решение:
Изменение кодировки с 16 бит на 8 бит, равно 16 - 8 = 8 бит. Следовательно информационный объем каждого символа сообщения уменьшился на 8 бит. Так как объем информационного сообщения уменьшился на 800 бит, следовательно количество символов в сообщение равно 800/8=100.

Ответ: Длина сообщения – 100 символов.

Пример 4. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16–битном коде Unicode, в 8–битную кодировку Windows–1251, при этом информационный объем сообщения составил 60 байт. Определите информационный объем сообщения до перекодировки.

Решение:
По условиям задачи информационный объем сообщения после кодировки составил 60 байт = 480 бит, следовательно количество символов в сообщении = 480/8 = 60. До перекодировки сообщение кодировалось 16-битным кодом, следовательно, информационный объем сообщения до перекодировки = 60 * 16 = 960 бит.

Ответ: информационный объем сообщения до перекодировки 960 бит.

Пример 5. Сколько потребуется памяти под хранение 2 страниц с текстом, если на каждой странице по 50 строк, в каждой строке по 60 символов? (кодировка CP1251)

Решение.

Находим общее количество символов:

50*60 = 300 символов на одной странице.

300*2 = 600 символов всего в тексте.

В кодировке CP1251 каждый символ кодируется одним байтом.

Ответ: 600 байт.

Контрольные вопросы и задания

1. Закодируйте с помощью таблицы CP1251 слово «информация».

2. Почему иногда на экране монитора вместо текстовой информации можно видеть ÿÿÿÿ и т.п.

3. Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 7–битном коде ASCII, в 16–битную кодировку Unicode. При этом информационное сообщение увеличилось на …

4. 2. Автоматическое устройство осуществило перекодировку информационного сообщения, первоначально записанного в 7-битном коде ASCII, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 108 бит. Какова длина сообщения в символах?

5. Определить объем памяти в Кбайтах, занимаемый текстом из 60 страниц по 512 символов на каждой странице. (кодировка ASCII)

6. Сообщение занимает 3 страницы и содержит 7950 байтов информации. Сколько строк на странице, если символов в каждой строке 25 и использована кодировка Unicode?

7. Определить максимальное количество страниц текста, содержащего по 80 символов в каждой строке и 64 строки на странице, которое может содержать файл, сохраненный на гибком магнитном диске объемом 10 Кб (кодировка ASCII)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: