Свойства и структура документированной информации

ставление об её объёме может дать физический уровень, т. е. натуральный (физический) объём, занимаемый информа­цией. Так, первоначальное представление о документах на бу­мажных носителях можно получить, измерив их по количеству листов (страниц) или же в килограммах, в кубических метрах, а также по количеству книг в общественных и личных библио­теках, по числу единиц хранения (дел) и даже по длине полок в архивохранилищах. Для аудиовизуальных и машиночитаемых документов могут быть использованы такие единицы измере­ния, как длина киноплёнки или магнитной ленты в метрах, ко­личество фотографических кадров, видеокассет, дискет, опти­ческих дисков и т. п.

Физический объём письменных документов можно выра­зить в печатных листах. Печатный лист (печ. л.) — это оттиск на одной стороне листа бумаги формата 60x90 см. Использует­ся также понятие условного печатного листа (усл. печ. л.). В условных печатных листах просчитываются оттиски на бумаге других форматов (например, 70^90 см и др.) через специаль­ный коэффициент.

Информационный объём документа может быть выражен в учётно-издательских (уч.-изд. л.) и авторских листах (авт. л.). В этом случае осуществляется переход уже на синтаксический (знаковый) уровень. Учётно-издательский лист, также как и ав­торский лист, равен 40 тыс. печатных знаков, включая пробе­лы между словами, или 700 строкам стихотворного текста, или 3000 см2 графического материала (иллюстраций, карт и т. п.).

В информатике количество информации определяется с помощью двух стандартных единиц измерения: бит (один символ двоичного алфавита, т. е. двоичная цифра, используе­мая для кодирования любой информации) и байт. Восемь бит составляют 1 байт; 1 килобайт (Кбайт) — 1024 байт; 1 мега­байт (Мбайт) = 1024 Кбайт = 1048576 байт; 1 гигабайт (Гбайт) = около 1 млрд. байт и т. д.

Отношение информационного объёма документа (синтак­сического уровня) к физическому объёму свидетельствует о компактности документа.

Однако физический объём документа, также как и количе­ство Жаков в нём, т. е. синтаксический уровень не дают пред-


Документоведение

ставления о реальном количестве информации в документе. Подсчитать же это реальное количество весьма непросто. Не случайно отдельные авторы вообще считают подобный под­счёт невозможным.

Действительно, с позиций метрологии нереально опреде­лить семантический уровень документа, поскольку измерению в данном случае подвергаются свойства социальных явлений и процессов, получивших отражение в документах. Измерением этих свойств занимается статистика, а в роли средств измере­ния выступают не технические устройства, позволяющие со­поставить измеряемую величину с эталоном, а те или иные со­циальные структуры1. Функции измерительных устройств, со­поставляющих явления или процессы с мерой, выполняют, в частности, управленческие работники, социологи, юристы, экономисты, политики, журналисты.

В поисках наиболее эффективных путей измерения реаль­ного количества документированной информации предлагают­ся различные способы, используются разные понятия. В част­ности, некоторые исследователи (Б. В. Бирюков, Г. Г. Воро­бьёв) предлагают так называемый тезаурусный подход. Для обозначения реального количества информации, вложенного в какой-либо информационный объём (в книгу, газету, офици­альный документ и т. п.), вводится понятие информационная ёмкость. Реальное же количество информации, извлекаемое конкретным потребителем, т. е. количество новой для данного потребителя информации, обозначается понятием информа­тивность документа.

Содержание всей информации в определённой информа­ционной системе называется «тезаурус» (от греч. "Й1ёзаиго$" — запас). «С точки зрения информативности те­заурус каждого сообщения делится на три части: 1) основ­ная информативность — то, что дано и что получено; 2) по­тери информативности — то, что дано, но не получено из-за рассеянности, спешки, незнания языка или предмета; 3) бес­полезная (избыточная) информация — информационный

Данилин С. Н. О современном понятии информации // Информа­ционные технологии. 2003. № П. С. 57.

Свойства и структура документированной информации

шум»1. В ряде случаев избыточность информации создаётся преднамеренно, чтобы повысить вероятность доведения её до потребителя, в частности, в учебной литературе, но осо­бенно — в рекламе, в агитационно-пропагандистской доку­ментации.

Приёмник информации (реципиент) также имеет свой те­заурус, который отличается от тезауруса документа, но тоже делится на три части: 1) основная информативность — то, что дано и что получено; 2) простая ассоциативная информатив­ность — то, что автор не дал, но подразумевал и предполагал дать и получатель сумел извлечь, благодаря своей квалифика­ции; 3) сложная ассоциативная информативность — то, что ав­тор не дал, не предполагал давать, но получатель извлёк.

Без ассоциативной информативности невозможен творче­ский процесс во многих областях человеческой деятельности. Использование языка ассоциативных понятий позволяет суще­ственно повышать информационную ёмкость документа. По­требитель обычно получает извне лишь определённую часть информации. Она «играет роль возбудителя, вызывающего возрастание информации внутри сознания получателя» (Ю. М. Лотман). Поэты, писатели, художники, работая над своими произведениями, практически всегда рассчитывают на наличие у своих будущих читателей простой ассоциативной информативности. Достаточно вспомнить басни И. А. Кры­лова, где героями выступают животные, но в действительности автор имеет в виду людей, высмеивая именно их недостатки и слабости. Читатель об этом догадывается, получая, таким об­разом, информацию, которую автор не дал, но предполагал дать. «Когда я пишу,— отмечал в этой же связи А. П. Чехов, — я вполне рассчитываю на читателя, полагая, что недостающие в рассказе субъективные элементы он подба­вит сам»2. Без сложной ассоциативной информативности не­мыслимы эффективное развитие научных исследований, появ­ление открытий и изобретений.

1 Воробьёв Г. Г. Твоя информационная культура. М., 1988. С. 71-72.

2 Чехов А П. Собр. соч. Т. 11. Письма. 1877-1892. М, 1963. С. 412.


Документоведение

Цифровая оценка информативности осуществляется путём составления двух списков дескрипторов (от англ. "йезсгу" — распознавать), т. е. значимых слов или словосочетаний, несу­щих смысловую нагрузку и нередко именуемых ключевыми словами. В первый список помещаются все дескрипторы до­кумента, а во второй — дескрипторы получателя, приёмника. Количество дескрипторов, повторяющихся в обоих списках, служит показателем информативности.

Подобный метод часто используется на практике. В част­ности, в 1950-е гг., вскоре после смерти И. В. Сталина, запад­ные специалисты-советологи на основе количественного ана­лиза опубликованных в газете «Правда» статей обнаружили резкое снижение числа упоминаний о «вожде всех времён и народов». На этом основании аналитики пришли к выводу» что преемники Сталина стремятся дистанцироваться от него. И действительно, вскоре на XX съезде КПСС лидер правящей партии Н. С. Хрущёв выступил со знаменитым докладом о ра­зоблачении культа личности Сталина и его последствий.

Отношение информационной ёмкости к информационному объёму (к синтаксическому уровню) называется информаци­онной плотностью документа. Чем больше количество деск­рипторов в единице объёма, тем, следовательно, плотнее текст документа.

Информационная плотность зависит от языка. К примеру, текст на английском языке обычно более плотный, чем на не­мецком. Причём статья, напечатанная в США, отличается большей плотностью, чем в Великобритании.

На информационную плотность влияет также стиль, вы­бранный для конкретного документа или присущий данной от­расли знания, либо характерный для данного жанра, в данном органе печати или у данного автора. Тезисы какого-либо со­общения, доклада имеют большую плотность, нежели сам опубликованный доклад. Документы технического, естествен­но-научного, делового содержания обладают большей плотно­стью, чем гуманитарные. Математик, физик, биолог, инженер пишут более плотно, чем философ, политолог или историк.

Документированную информацию малой плотности можно быстро и легко просматривать, тогда как документы с относи-

Свойства и структура документированной информации

тельно большой плотностью требуют чтения целиком. Вдоба­вок следует иметь в виду, что в больших произведениях плот­ность изменяется от начала к концу документа. Медленно воз­растая и достигая максимума приблизительно к концу первой трети объёма, плотность документированной информации идёт затем на убыль и перед концом достигает минимума. Однако в самом конце происходит резкий её рост за счёт заключения, выводов1.

Кроме того, информационная ёмкость и информативность документа зависят от структуры, степени формализации и т. п.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: