Методы получения вторичной информации

Методы анализа документов. Для получения нужной информации необходимо использование методов анализа изучаемых данных. Всю совокупность носителей таких данных называют документами.

Выделяют два основных типа анализа: традиционный, класси­ческий, и формализованный, количественный — контент-анализ.

Существенно различаясь между собой, они не исключают, а вза­имно дополняют друг друга, позволяя компенсировать имеющиеся недостатки. Анализ документов используется главным образом при работе с вторичными данными.

Традиционный анализ — это цепь логических построений, на­правленных на выявление сути анализируемого материала. Интере­сующая информация, заложенная в документе, часто присутствует в неявном виде, в форме, отвечающей целям созданного докумен­та, но не всегда отвечающей целям конкретного исследования.

Традиционный анализ позволяет улавливать основные мысли и идеи, оценить скрытые стороны содержания документа, проник­нуть вглубь документа, исчерпать его содержание. Основным его недостатком является субъективность.

При проведении традиционного анализа необходимо ответить на следующие вопросы. Что представляет собой документ? Каков его контекст? Кто его автор? Каковы цели создания документа? Какова надежность самого документа? Какова достоверность за­фиксированных в нем данных? Каково фактическое содержание документа? Каково оценочное содержание документа? Какие вы­воды можно сделать о фактах, содержащихся в документе? Какие выводы можно сделать об оценках, содержащихся в документе? В традиционном анализе различают внешний и внутренний анализ. Внешний анализ — это анализ контекста документа в собствен­ном смысле этого слова и всех тех обстоятельств, которые сопут­ствовали его появлению. Цель внешнего анализа — установить вид документа, его форму, время и место появления. Определяются автор и инициатор создания документа, цели его создания, достовер­ность и суть его контекста.

Пренебрежение таким анализом во многих случаях грозит не­верным истолкованием содержания документа. Например, сиюми­нутная политическая ситуация может диктовать тенденциозную оценку событий.

Внутренний анализ — это исследование содержания документа. По существу, вся работа направлена на проведение внутреннего анализа документа, включающего выявление уровня "достовернос­ти приводимых фактов и цифр, установление уровня компетенции автора документа, выяснение его личного отношения к описывае­мым в документе фактам.

Искажения могут возникать не только в результате личной сим­патии или антипатии автора; источником искажения выступает и методологическая позиция автора. Авторы, придерживающиеся раз­ных теоретических позиций, могут признать существенными в объяс­нении конкретного явления разные факты.

Некоторые документы требуют специальных методов анализа.

Психологический анализ применяется, как правило, при оценке отношения автора к какому-либо политическому, экономическому или социальному явлению. На основе таких исследований может быть получено представление о формировании общественного мне­ния, общественных установок.

Юридический анализ — применяется для всех видов юридических документов, В юриспруденции используется специфический словарь терминов, замена которых недопустима. Незнание юридического словаря при анализе юридических документов может привести к грубым ошибкам.

Формализованный анализ документов позволяет избавиться от субъективности за счет применения количественных методов.

Суть этих методов сводится к тому, чтобы найти такие подсчи­тываемые признаки, черты, свойства документа, например, такой признак, как частота употребления определенных терминов, кото­рые отражают существенные стороны содержания. Качественное содержание делается измеримым, становится доступным точным вычислительным операциям. Ограниченность формализованного анализа заключается в том, что далеко не все содержание докумен­та может быть измерено с помощью формальных показателей.

Контент-анализ — это техника выведения заключения, произ­водимого благодаря объективному и систематическому выявлению соответствующих задачам исследования характеристик текста. Под­разумевается, что применение такой техники включает в себя не­которые стандартизованные процедуры, часто предполагающие измерение.

На практике определились некоторые общие принципы целесо­образности и полезности применения методов количественного ана­лиза: 1) когда требуется высокая степень точности или объектив­ности анализа; 2) при наличии обширного по объему и несистема­тизированного материала; 3) когда важные категории характеризу­ются определенной частотой появления в изучаемых документах.

Требование объективности анализа делает необходимым пере­вод исследуемого материала на язык гипотез в единицах, которые позволяют точно описать характеристики текста. В связи с этим ис­следователю приходится решать ряд проблем, связанных с выра­боткой категорий анализа, с выделением единиц анализа и единиц счета.

Категории анализа — это понятия, в соответствии с которыми будут сортироваться единицы анализа — единицы содержания. При разработке категорий важно учитывать, что от их выбора будет в значительной степени зависеть характер полученных результатов. Как правило, необходимо несколько раз переходить от теоретичес­кой схемы к документальным данным, а от них — снова к схеме, чтобы исходя из выбранной гипотезы выработать категории, соот­ветствующие задачам исследования.

Категории должны быть исчерпывающими, охватывать все час­ти содержания, определяемые задачами данного исследования. Ка­тегории должны отвечать требованию надежности, их следует сфор­мулировать так, чтобы у различных исследователей была достаточ­но высокая степень согласия по поводу того, какие части содержа­ния следует отнести к той или иной категории.

Эффективным способом повышения надежности категории яв­ляется ее исчерпывающее определение и перечисление всех входя­щих в нее элементов. Тогда обработка документа сводится к чисто техническим процедурам, для выполнения которых могут исполь­зоваться средства электронных офисов. Например, можно исполь­зовать текстовые редакторы офиса Microsoft Office 97.

При проведении формализованного анализа содержания нужно четко указать признаки, по которым определенные единицы отно­сятся к определенным категориям.

Единицей анализа — смысловой или качественной — является та часть содержания, которая выделяется как элемент, подводи­мый под ту или иную категорию. В тексте она может быть выражена по-разному: одним словом, некоторым устойчивым сочетанием слов или может вообще не иметь явного терминологического выраже­ния, а преподноситься описательно или скрываться в заголовке абзаца, раздела. Поэтому возникает задача выделения признаков — индикаторов, по которым определяется наличие в тексте интересу­ющей темы.

Индикаторы могут быть неоднородны: относящиеся к теме слова и словосочетания, термины, имена людей, названия организаций, географические названия, пути решения экономических проблем.

При изучении экономических проблем смысловые единицы мо­гут включать внутренние и международные события; лиц и авто­ров, описывающих эти события или являющихся их инициаторами и пропагандистами; отношение к событиям в терминах: "за — про­тив", "выгодно — невыгодно", "хорошо — плохо", в чьих это ин­тересах. Определены некоторые "стандартные" смысловые едини­цы, приведенные ниже.

Понятие, выраженное отдельным словом, термином или сочета­нием слов. Применение такой единицы целесообразно при изучении способов, с помощью которых источник информации организует сообщение, передает свои намерения тем, кому оно направлено.

Тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах. Тема является важной смысловой единицей при анализе направленности интересов, ценностных ориентации, уста­новок тех, кто передает сообщение. Однако определение темы час то затруднено в связи с неясностью текста. Тому, кто проводит анализ, приходится определять тему и ее границы внутри текста. Выбор темы в качестве единицы анализа подразумевает также внут­реннее разделение текста на определенные части, внутри которых тема может быть определена.

Имена людей, географические названия, марки продуктов, названия организаций, упоминание какого-либо события. Частота и длительность промежутка времени, с которыми они присутствуют в сообщении, могут послужить показателями их важности, значимости для ис­следуемого объекта.

Выбрав смысловую единицу и ее индикаторы, необходимо оп­ределить также единицу счета, которая станет основанием для ко­личественного анализа материала.

Единица счета "время —пространство ". Подсчет в этой системе пригоден в основном при исследовании сообщений, передаваемых средствами массовой информации. За единицы счета здесь прини­маются числа строк, абзацев, квадратных сантиметров площади, знаков, колонок в печатных текстах, посвященных тому или иному вопросу, мнению, оценке. Для кино, радио и телевидения едини­цей счета будет время, отведенное освещению определенного со­бытия.

Единица счета "появление признака ". Такая система счета подра­зумевает необходимость отмечать наличие определенной характе­ристики в любом ее проявлении; например, упоминание опреде­ленной марки товара в каждой из единиц контекстов. Иногда отме­чается лишь появление признака, а повторение данной характери­стики внутри единицы контекстов не учитывается.

Единица счета "частота появления". Самым распространенным способом измерения характеристик содержания является подсчет частот их употребления, когда фиксируется каждое появление лю­бого признака данной характеристики. В зависимости от того, ка­кие единицы счета выбираются, частота может использоваться для решения различных задач.

Частота появления темы в том или ином документе может слу­жить показателем ее значимости с точки зрения автора документа. Подсчет оценочных характеристик текста позволяет подойти к ис­следованию установок автора сообщения и к выявлению намере­ний, которыми было продиктовано сообщение.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: