Мера информации синтаксического уровня

Рис. 2.1. Этапы обращения информации

Сбор информации- процесс идентификации и получения информации от различных источников и представление в форме необходимой для дальнейшей передачи и обработки или регистрации.

Под передачей данных понимают процесс перемещения, пересылку данных от источника к приемнику. Схема передачи информации включает в себя передатчик, канал связи и приемник. Для передачи сообщения используют физический процесс (звуковая волна, электрический ток, световой поток, магнитное поле и.т.д.).

Накопление данных (хранение) - процесс перемещения данных во времени, связанный с обеспечением неизменного состояния носителя. Носитель - это материальный перемещаемый в пространстве объект, способный воспринимать информацию и предназначенный для ее хранения в течении длительного времени и позволяющий воспроизводить сохраненную информацию человеком непосредственно или с помощью технических средств.

Регистрацией называется запись информации на носитель в целях ее сохранения и последующего использования.

Обработка информации - любое ее преобразование, проводимое по законам логики, математики, а также неформальным правилам, основанным на здравом смысле, интуиции, обобщенном опыте, сложившихся взглядов и нормах поведения. Результатом обработки является информация представленная в иных формах (отсортированная иным образом) или содержащая ответы на поставленные вопросы.

Поиском информации называют совокупность операций, методов и процедур, результатом выполнения которых является отбор данных, хранящихся в запоминающем устройстве по заданной теме или запросу.

Отображение и вывод информации изЭВМ- визуальное представление выводимых данных, вывод в форме речи или звуков.

Под информационной технологией понимают совокупность методов, производственных и программно-технологических средств, объединенных в технологическую цепочку, обеспечивающую сбор, хранение, обработку, вывод и распространение информации.

Понятие информатики

Термин «и нформатика» (computer science) обозначает совокупность научных направлений, изучающих информацию, информационные процессы в природе, обществе, технике, формализацию и моделирование как методы познания, способы представления, накопления, обработки и передачи информации с помощью технических средств. Информатика стала развиваться с середины нашего столетия, когда появились специальные устройства — компьютеры, ориентированные на хранение и преобразование информации, и произошла компьютерная революция.

В информатике можно выделить восемь основных направлений:

теоретическая информатика;

кибернетика;

программирование;

искусственный интеллект;

информационные системы;

вычислительная техника;

информатика в обществе;

информатика в природе.

Основные направлениями информатики являются теория информации; разработка новых аппаратных средств (hardware); разработка программного обеспечения (software); языки программирования; компьютерные сети; робототехнические средства и системы искусственного интеллекта.

Материальной и технологической базой развития современного общества стали различного рода системы на базе компьютерной техники и компьютерных сетей, информационные технологии, телекоммуникационные системы.

Информатика - отнюдь не только «чистая наука». У нее, безусловно, имеется научное ядро, но важная особенность информатики - широчайшие приложения, охватывающие почти все виды человеческой деятельности: производство, управление, науку, образование, проектные разработки, торговлю, финансовую сферу, медицину, криминалистику, охрану окружающей среды и др. И, может быть, главное из них - совершенствование социального управления на основе новых информационных технологий.

Как наука, информатика изучает общие закономерности, свойственные информационным процессам (в самом широком смысле этого понятия). Когда разрабатываются новые носители информации, каналы связи, приемы кодирования, визуального отображения информации и многое другое, конкретная природа этой информации почти не имеет значения. Для разработчика системы управления базами данных (СУБД) важны общие принципы организации и эффективность поиска данных, а не то, какие конкретно данные будут затем заложены в базу многочисленными пользователями. Эти общие закономерности есть предмет информатики как науки.

Объектом приложений информатики являются самые различные науки и области практической деятельности, для которых она стала непрерывным источником самых современных технологий, называемых часто «новые информационные технологии» (НИТ). Многообразные информационные технологии, функционирующие в разных видах человеческой деятельности (управлении производственным процессом, проектировании, финансовых операциях, образовании и т.п.), имея общие черты, в то же время существенно различаются между собой.

Характеристики, меры и единицы измерения информации

Сообщения как совокупность знаков с точки зрения семиотики изучается на трех уровнях:

синтаксический уровень, где рассматриваются отношения между знаками;

семантический уровень, где анализируется отношения между знаками и обозначаемыми ими предметами;

 прагматический уровень, где рассматриваются отношения между знаками и получателем сообщений.

Мера информации синтаксического уровня

Количественная мера оценки информации этого уровня не связана со смыслом информации, ее содержанием. Для измерения информации на синтаксическом уровне используют характеристики объема и количества информации.

Рассмотрим понятие объема информации. Пусть задан алфавит, включающий множество символов, каждый из которых занимает в памяти объем равный u и, допустим, что информация содержится в сообщении, состоящим из N символов. Тогда объем информации сообщения можно определить, используя выражение:

V=N×u (единица объема).

Под количеством информации понимают меру снятия неопределенности ситуации при получении сообщения.

Хартли в 1928 году предложил степень неопределенности ситуации с N исходами характеризовать числом: log N. Если в результате получения сообщения количество исходов ситуации уменьшается до M, то количество информации в полученном сообщении определяется выражением:

I = H0 ¾ H1,  (1)

где H0 = log N ¾ неопределенность ситуации x до получения сообщения y, H1 = log M ¾ неопределенность ситуации, оставшаяся после получения сообщения.

Для определения количества информации, содержащегося в сообщении, необходимо выполнить следующие действия:

1. Найти N -количество исходов ситуации до получения сообщения;

2. Найти M - количество исходов ситуации после получения сообщения;

3. Воспользоваться выражением (1) и найти количество информации, содержащиеся в сообщении.

За единицу количества информации принимается один бит, который соответствует сообщению о ситуации, имеющей два исхода до получения сообщения, а при получении сообщения - единственный исход:

I =log 2 ¾ log 1 =1 бит.

Применяемые единицы измерения количества информации приведены в таблице 1.

Таблица 1.

Название единицы Обозначение единицы Соотношения между единицами измерения количества информации
1 байт байт 1 байт = 8 бит
2 Килобайт Кбайт 1 Кбайт = 1024 байт = 210 байт
3 Мегабайт Мбайт 1 Мбайт = 1024 Кбайт = 220 байт
4 Гигабайт Гбайт 1 Гбайт = 1024 Мбайт = 230 байт
5 Терабайт Тбайт 1 Тбайт = 1024 Гбайт = 240 байт

Рассмотрим пример определения количества информации содержащегося в сообщении.

В княжестве имеются автомобили только черного, серого и белого цвета. Количество информации сообщения «В аварию попал автомобиль не черного цвета» равен 8 - log25 бит. Количество информации сообщения «В аварию попал серый автомобиль» равно 8 бит. Какое количество информации в сообщении о том, что в аварию попал автомобиль белого цвета.

Обозначим через x, y и z количество автомобилей черного, серого и белого цвета. Тогда в княжестве имеется x + y + z автомобилей.

Степень неопределенности при попадании одного автомобиля в аварию равна:

H1 = log2(x + y + z)

Степень неопределенности при попадании в аварию автомобиля не черного цвета (серого и белого автомобиля) равна:

H2 = log2(y + z).

Количество информации, содержащиеся в сообщении «В аварию попал автомобиль не черного цвета», равно:

I = H1 - H2 = log2(x + y + z) - log2(y + z) = 8 - log25.

Степень неопределенности при попадании в аварию серого автомобиля равна:

H3 = log2y.

Количество информации, содержащиеся в сообщении «В аварию попал серый автомобиль», равно:

I = H1 - H3 = log2(x + y + z) - log2y = 8 (2).

Предположим, что x + y + z = 8, а y+ z = 5 (3). Тогда из (2) находим y:

log2(x + y + z) - log2y = 8 - log2y = 8;

log2y = 0;

y = 1.

Тогда из (3) можно найти z:

y+ z = 5;

1 + z = 5;

z= 4.

Степень неопределенности при попадании в аварию белого автомобиля равна:

H4 = log2z = log24 = 2.

Количество информации, содержащиеся в сообщении «В аварию попал белый автомобиль», равно:

I = H1 - H4 = log2(x + y + z) - log2z = 8 - 2 =6.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: