Информационный анализ текстов, потенциально
Современная наука располагает достаточно большим числом разновидностей анализа документальных источников: применяемый в социологии и социальной психологии контент-анализ, в архивоведении и информатике — методы аналитической обработки первоисточников для создания массивов вторичных элементов (обзоров, рефератов, аннотаций и пр.), виды индексирования (кодирования) содержащейся в источниках фактической информации; методы целевого преобразования текстов первоисточников, содержание которых в зависимости от поисковой задачи расчленяется на блоки информации, пригодной для хранения в памяти ЭВМ; банки данных, используемые в ходе вторичной обработки банка уже использованной информации для построения различных информационных систем. Общая и наиболее существенная характеристика, объединяющая все эти методы — минимизация элемента субъективности при изучении текстовых материалов и выведение анализа текстов на возможно более объективную научную основу. Отсюда — тенденция к разработке обоснования критериев как для отбора источников, подлежащих информационному анализу, так и для формализованного представления содержащейся в них информации — непременного условия последующей статистической обработки.
Информационный анализ разнопредметных и разнотипных текстов, описывающих самые различные подсистемы человеческой деятельности, позволяет:
1) систематически обрабатывать и сопоставлять имеющиеся в литературе представления об изучаемом объекте, о соответствующих этим представлениям подходах к конструированию систем социальных показателей. Этот вид информационного анализа ориентирован на последовательное изучение уже существующих концепций гносеологического объекта и связанных с ними категорий. Он предполагает систематическое обследование текстов, содержащих названные концепции, в целях сопоставления и систематизации имеющихся в них сведений;
2) сводить разнопредметные знания об этом социальном объекте в систему под избранным углом зрения. Этот менее распространенный вид, так называемый информационно-целевой анализ, ориентированный непосредственно на гносеологический объект, на гипотезу относительно сущности исследуемого объекта, воспроизведение целостности которого на языке показателей является целью проводимого анализа. По характеру проведения он похож на эксперимент, где в качестве объекта исследования выступает совокупность текстов, причем каждый конкретный текст признается информативным для исследователя лишь в той мере, в какой в его содержании обнаруживаются сведения, соответствующие целям предпринимаемого эксперимента.
При информационно-целевом анализе тексту приписывается некоторая мера информативности, которая поддается измерению и может быть как первичной — характеризующей потенциальную способность конкретного текста донести до читающего замысел, основное коммуникативное намерение его автора, так и вторичной — характеризующей потенциальную способность конкретного текста служить источником тех сведений, которые ищет в нем читатель. При этом вторичная информативность текста часто не только не совпадает с первичной, но в абстракции от нее приводит к искажению смысловой информации, заложенной в тексте.
Исследовательская ситуация складывается таким образом, что на первый план выходит вторичная информативность текста Необходимость отвлечения от конкретных коммуникативных целей автора текста (за исключением тех случаев, когда эти цели оказываются в русле гипотезы эксперимента) диктуется здесь самой задачей изучения информационного массива, направленной на то, чтобы выявить и систематизировать элементы, связанные с исследуемым объектом, а затем установить нормативные и реальные связи, в которые они вступают в рамках той или иной сферы функционирования объекта.
Будучи методом синтетическим, информационно-целевой анализ текстов соединяет в себе моменты, свойственные различным методам информационного анализа текстов: дедуктивному (контент-анализ), где исследователь подходит к тексту, располагая априорно сконструированными им аналитическими категориями, и индуктивному, где исследователь отталкивается от текста, фиксируя в нем искомые термины и терминологические конструкции, отвечающие задачам построения потенциальных показателей исследуемого объекта. Присутствует в нем и информационный подход к систематизации терминологии, в рамках которого извлеченные из текстов элементы берутся не сами по себе, а ставятся в жесткие координаты семантических отношений, основанных на предварительном анализе системы согласованных и взаимосвязанных дефиниций.
Построение системы социальных показателей на основе способа информационно-целевого анализа текстов предполагает использование двух групп методик, организованных на основе одного общего принципа: ориентация на выявление, с одной стороны, нормативных и с другой — реальных структур исследуемого социального объекта.
Первая группа методик включает информационно-целевой анализ текстов, описывающих те или иные сферы деятельности, и предназначается для извлечения из текстов данных, необходимых для построения нормативных моделей деятельности и взаимодействия социальных субъектов.
Вторая группа методик — опросы экспертов и населения, включенное наблюдение и пр. — предназначается для выявления реальных структур деятельности и взаимодействия социальных объектов. При этом в основу методик второй группы положена та же исследовательская схема, что и в основу предварительного информационно-целевого анализа текстовых массивов.
Для построения общей исследовательской схемы требуется дать обоснованные ответы на следующие вопросы:
1. Какая из компонент (а следовательно, из соответствующих ей категорий анализа) исследуемого объекта принимается за исходную при выработке операционального определения те что именно дополнить «ключом» при анализе текстов?
2. Какие элементы содержания текстов, по каким параметрам и почему должны быть приняты в расчет при информационно-целевом анализе текстов?
3. Какие методы можно использовать для трансформации выявленных элементов содержания текстов в параметры нормативных моделей деятельности и взаимодействия социальных субъектов способные служить основой для построения системы нормативных показателей.
4. На основе какой информации такие показатели смогут получить не только качественное, но и количественное выражение?
Иначе говоря, прежде чем приступить к анализу текстов с целью выявления элементов, составляющих основу систем показателей социальных явлений, необходимо провести основательную теоретико-методологическую работу по концептуализации объекта исследования в таком плане, чтобы соответствующие элементы текста «трансформировались» в показатели не случайно, а в соответствии с определенными критериями, заложенными в программу исследования.
Первый этап собственно исследования начинают с пилотажного анализа текстов, что позволит уточнить список основополагающих категорий анализа, более четко определить характер соответствующих этим критериям эмпирических референтов, после чего составить вопросники для сбора информации, сопоставимой с результатами последующего информационно-целевого анализа текстов.
Далее следует опрос и включенное наблюдение исследователя как способы формирования массива первичной информации, пригодной для сопоставления со вторичной информацией, полученной из анализа литературы. Используют два вопросника: один адресован рядовым гражданам, представителям различных социальных групп населения, второй — должностным лицам или специалистам. Каждый вопросник выполняется в двух вариантах: один выявляет настоящее положение вещей и планируемое будущее, второй — степень реализации намеченных планов спустя определенный период времени.
Второй этап составляет собственно анализ текстов. Во избежание ошибок и трудностей, связанных с анализом разнообразных источников, целесообразно вначале отработать методику выявления элементов текста в интересующем исследователя плане. Для этой цели лучше всего обследовать материалы нормативного характера, с четкими формулировками категорий (словари, справочники и т.п.). Приемы, отработанные на подобных четких и компактных текстах, нетрудно перевести на тексты, описывающие те или иные сферы интересующего нас объекта, а затем и на более расплывчатые и потому более трудные для аналитических операций тексты из литературы по исследуемой проблематике. Создание же перечней элементов содержания текстов, отвечающих избранным категориям анализа, позволяет путем рассмотрения их семантических связей в текстах различного характера перейти к построению «сеток отношений» между элементами, включенными в перечни, — необходимой предпосылки для систематизации совокупностей показателей, сведения их в системы. Возникает возможность использовать эти системы для построения не только исходных, но и прогностических моделей (поисковых и нормативных). Так, при наличии развернутых «сеток отношений» можно прогнозировать, в каких именно конкретных условиях оказываются необходимыми определенные параметры (признаки) социальных субъектов деятельности или, напротив, какие условия необходимы для заранее известных субъектов деятельности, или на какие результаты допустимо рассчитывать при заранее известных субъектах и условиях деятельности, или какие значения могут иметь эти результаты при прочих известных параметрах, и т.д.
Такая методика информационно-целевого анализа текстов требует усилий сравнительно большого рабочего коллектива в течение сравнительно долгого периода. Это можно минимизировать планомерным переходом от одной группы однородных текстов к другой, более сложной для обработки. Другой путь снижения трудоемкости и повышения эффективности этой методики — предварительное моделирование явлений и процессов, которые излагаются в текстах, подлежащих анализу. По сути дела, предлагаемая методика сама открывает один из путей к моделированию исследуемого объекта.
Построение исходной модели любым из предложенных способов преследует одну цель: формализовать объект прогнозирования, представить его в виде системы показателей, по каждому из которых можно будет построить динамические ряды (переменных, характеристик, конкретных данных) на всем протяжении периода основания и упреждения прогноза. Система показателей дает возможность осуществить качественный анализ того или иного динамического ряда, — построить матрицу или математическое уравнение, а главное, позволяет осуществить полноценный аналитический и диагностический подход к объекту исследования, без чего невозможен сам прогноз — поисковая или нормативная разработка исходных данных.