Кодирование текстовой информации

Текстовая информация представляет собой набор символов некоторого языка.

Язык – знаковая система представления информации. Множество символов языка образуют алфавит.

Языки бывают естественными и формальными. Естественные языки сложились в процессе общения людей, другими словами, естественные языки – это языки национальных культур. Формальные языки возникли из необходимости введения специальных символов в различных областях науки. Например, язык музыки представляет собой ноты и нотный стан, язык математики – это цифры, арифметические действия, специальные знаки %, / и т.д., язык дорожных правил – это знаки, разметка, сигналы регулировщика и светофора и т.п.

Алфавит компьютерного языка состоит из 256 символов, причем под каждый символ отводится 8 ячеек памяти, другими словами, информационный вес каждого символа равен 8 бит=1 байт. Эти 256 символов включают заглавные и прописные буквы двух алфавитов, математические символы, специальные символы. Все символы упорядочены, каждому символу соответствует некоторое число от 0 до 255.

Таблица ASCII содержит коды первых 128 символов (0-127). (см.приложение)

Остальные позиции заняты символами кириллицы (русскими буквами) и символами псевдографики. Существует несколько таблиц кодировки кириллицы – КОИ 8, Windows 1251-1252 и др. Их отличие в том, что буквам сопоставляются различные коды.

Кодирование графической информации.

Растровое представление графической информации

Изображение разбивается на мельчайшие элементы – пиксели.

Пиксель – минимальный участок изображения, которому можно независимым образом задать цвет. Палитра – множество цветов, используемых в изображении (весь набор красок). Все множество пикселей образуют растр.

Растр – это прямоугольная сетка пикселей на экране.

Стандартные размеры растра 800х600, 1024х768 и др. Это значит, что по горизонтали на экране монитора умещается 1024 (М) пикселя, а по вертикали 768 (N) пикселей. Тогда общее количество пикселей может быть посчитано как K=MN.

Разрешающей способностью изображения называется отношение числа пикселей на единичный участок изображения. Единица измерения разрешающей способности – dpi (пикселей на дюйм).

Использую известную формулу 2i=N, где N – мощность алфавита (число цветов в палитре), можно посчитать, сколько бит информации содержит каждый символ (в нашем случае пиксель). Общий объем изображения можно вычислить по формуле V=KI, где K=mn.

 

Пример 1. Палитра состоит из 65536 цветов (N). Изображение состоит из 64х32 пикселя. Какой объем изображения в К байтах?

Решение: В палитре 65536 цветов. Значит, 2i=65536, откуда i=16 бит. Это значит, что каждый пиксель изображения «весит» 16 бит.

 

Пример 2. Известно, что объем изображения, записанного в 256-цветной палитре (N), равен 0,5 Кб (V). Каким количеством бит кодируется каждый пиксель (i)? Из сколько пикселей состоит изображение? Какой объем будет у изображения размером 128*64 пикселя (K)?

Решение: Палитра состоит из 256 цветов (N). Значит, под каждый пиксель отводится 2i=256, т.е. i=8 бит.

Объем изображения равен 0,5 Кбайт = 0,5.213 бит. V=KI, значит,

K=V/I=0.5.213/8=0.5.213/23=2-1+13-3=29=512 пикселей. Изображение состоит из 512 пикселей. Объем изображения равен 8Кбайт.

Кодирование звуковой информации

Персональные компьютеры получили возмож­ность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. С помощью специальных про­граммных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса.

Звуковой сигнал - это непрерывная волна с изменяющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компью­тер мог обрабатывать непрерывный звуковой сигнал, он должен быть дистретизирован, т.е. превращен в последовательность электрических им­пульсов (двоичных нулей и единиц).

При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок — отсчетов.

Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний.

Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц. При частоте 8 Кгц качество дискредитированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 Кгц - качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы. Можно оценить информационный объем моном аудио файла длительно­стью звучания 1 секунду при среднем качестве звука (16 бит, 24 Кгц). Для этого количество бит на одну выборку необходимо умножить на количе­ство выборок в 1 секунду:16 бит. 24000 = 384000 бит = 48000 байт или 47 Кбайт.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: