Прикладные модели информационного управления

«Принцип дефицита». Книга американского психолога Р. Чалдини посвящена описанию и классификации стереотипов поведения, которым зачастую следуют люди, принимая те или иные решения. Эти стереотипы представляют собой некие «программы», которые «включаются» при определенных обстоятельствах и предопределяют действия человека, в том числе и явно иррациональные действия. Р. Чалдини выделяет шесть «фундаментальных психологических принципов, которые лежат в основе человеческого поведения»: принцип последовательности, принцип взаимного обмена, принцип социального доказательства, принцип авторитета, принцип благорасположения, принцип дефицита (здесь и далее до конца лекции будем ссылаться на работу Р. Чалдини). Остановимся на последнем из этих принципов.

Суть принципа дефицита состоит в следующем: «ценность чего-либо позитивного в наших глазах существенно увеличивается, если оно становится недоступным». В частности, это относится к дефицитной информации, причем «эксклюзивная информация является более убедительной. В качестве одного из подтверждений этого тезиса приводится следующий эксперимент, проведенный изучавшим психологию бизнесменом, владельцем компании, импортирующей в США говядину.

«Торговые агенты позвонили, как обычно, постоянным клиентам компании – закупщикам говядины для супермаркетов и других точек, торгующих продуктами в розницу, и одним из трех способов предложили им сделать заказ. Одни клиенты услышали предложение, сделанное в стандартной форме. Другим клиентам дополнительно была предоставлена информация о том, что поставки импортной говядины будут сокращены в ближайшие несколько месяцев. Третья группа клиентов получила те же сведения, что и вторая группа, а также информацию о том, что мало кто узнает о предстоящем сокращении поставок, так как эти сведения поступили из надежного, но засекреченного источника.

… По сравнению с клиентами, которым было сделано торговое предложение в стандартной форме, те клиенты, которым было также сказано о дефиците говядины, заказали ее в два раза больше… Клиенты, которые решили, что владеют «исключительной» информацией… приобрели в шесть раз больше говядины, чем клиенты, которым было сделано торговое предложение в стандартной форме. Очевидно, сообщение о том, что информация о дефиците сама является дефицитной, сделала данную информацию особенно убедительной».

Не подвергая сомнению справедливость выводов Р. Чалдини, попробуем взглянуть на ситуацию несколько по-иному и объяснить действия клиентов компании, исходя из теоретико-игровой модели.

Итак, пусть имеется n клиентов компании - далее будем называть их агентами - принимающих решение об объемах закупки говядины. Будем считать, что число агентов n достаточно велико, все агенты идентичны и конкурируют по Курно при линейной зависимости цены от предложения. Это означает, что целевые функции агентов выглядят следующим образом:

где . Содержательно, x_i - объем продаж агента за рассматриваемый период времени, - цена, которая при этом устанавливается на рынке, c - оптовая цена, по которой агенты закупают товар. Тогда первое слагаемое в целевой функции может интерпретироваться как произведение цены на объем продаж - выручка от продаж, а второе слагаемое - как затраты на закупку товара.

Дифференцируя целевые функции, приравнивая производные к нулю и решая получившуюся систему, можно найти равновесные действия агентов в условиях общего знания:

, (6.16)

(по предположению все агенты идентичны, поэтому их равновесные действия одинаковы). Такова ситуация в отсутствии информационного воздействия. Агенты первого типа, которым было сделано предложение в стандартной форме, закупили товар в объеме (6.16), рассчитывая реализовать его в данный период времени.

Рассмотрим теперь поведение агентов второго типа, которым было сообщено, что поставки будут сокращены. Можно предположить, что они считали этот факт общим знанием. В таком случае для них рациональным действием было закупить в два раза больше товара, чтобы иметь возможность реализовать его в следующий период времени в том же равновесном количестве (6.16) (и одновременно заниматься поисками других поставщиков).

Наконец, рассмотрим поведение агентов третьего типа, которым было сообщено, что поставки будут сокращены и эта информация доступна лишь некоторому числу агентов. Для таких агентов, возможно, рационально предположить следующее. Существуют два типа агентов - неинформированные и информированные (инсайдеры), к которым агенты третьего типа относят себя. Неинформированные агенты в данном периоде будут реализовывать товар в объеме (6.16), а в следующем, не имея товара, прекратят участие в игре. Таким образом, число игроков в следующем периоде (равное числу инсайдеров) сократится с п до некоторого числа kn, k< 1, где k - доля инсайдеров. Тогда в следующем периоде равновесным будет действие:

. (6.17)

Сравнивая (6.16) и (6.17) легко видеть, что при больших п имеет место соотношение:

Поэтому агенты третьего типа закупали товар в объеме (x_i + x’_i), т. е. в раз больше, чем агенты первого типа. Если доля инсайдеров составляет, с точки зрения агентов третьего типа, пятую часть от общего числа агентов (то есть k= 1/5и этот факт субъективно является общим знанием), то получаем:

x_i + x’_i =6 х_i.

В этом случае рациональным для агентов третьего типа является закупка в 6 раз большего объема товара, чем для агентов первого типа. Таким образом, при сделанных предположениях мы получаем именно тот результат, который описан в книге Р. Чалдини.

Аккордная оплата труда. Рассмотрим организационную систему, состоящую из центра и п агентов, осуществляющих совместную деятельность.

Стратегией i -го агента является выбор действия ,стратегией центра - выбор системы стимулирования, определяющей размер вознаграждения каждого агента в зависимости от результата их совместной деятельности. Предположим, что технология взаимодействия агентов такова, что для достижения требуемого результата необходимо, чтобы сумма их действий была не меньше заданной величины . В этом случае i -й агент получает от центра фиксированное вознаграждение ,в случае же вознаграждение каждого агента равно нулю.

Реализация действия требует от i -го агента затрат c_i (y, r_i), где r_i> 0 - его тип (параметр, описывающий индивидуальные характеристики), .

Относительно функций затрат агентов предположим, что c_i (y,r_i) - непрерывная возрастающая по y_i и убывающая по r_i функция, причем .

Описанную модель взаимодействия будем далее называть игрой «Аккордная оплата труда». Определим множество индивидуально рациональных действий агентов:

Если затраты агентов сепарабельны, то есть затраты c_i (y_i,r_i) каждого агента зависят только от его собственных действий и не зависят от действий других агентов, получаем, что,

где:

Обозначим:

Рассмотрим последовательно различные варианты информированности агентов о значении параметра . Как мы увидим, даже небольшое усложнение структуры информированности может существенно изменить множество информационных равновесий рассматриваемой рефлексивной игры.

Вариант I. Предположим, что значение является общим знанием. Тогда равновесием игры агентов является параметрическое равновесие Нэша, принадлежащее множеству:

. (6.18)

Определим также множество эффективных по Парето действий агентов:

. (6.19)

Так как ,то из (6.18) и (6.19) следует, что множество эффективных по Парето действий является одним из равновесий Нэша. Но множество равновесий Нэша может оказаться шире - в частности, при оно всегда содержит вектор нулевых действий.

Пусть функции затрат агентов являются функциями затрат типа Кобба-Дугласа: , где - гладкая монотонно возрастающая выпуклая функция, удовлетворяющая равенству .

Тогда эффективной по Парето является единственная точка: , где .

Вычислим , тогда при:

. (6.20)

множество Парето не пусто.

Множества равновесий Нэша в игре п=2 агентов для двух значений : приведены на рис. 6.10 (точка (0; 0) является равновесием Нэша в обоих случаях).

Итак, мы рассмотрели простейший вариант информированности агентов, соответствующий ситуации, когда значение параметра является общим знанием. Рассмотрим следующий (в порядке возрастания сложности структуры информированности агентов) вариант информированности, в рамках которого общим знанием являются индивидуальные представления {} агентов о значении параметра .

Вариант II. Предположим, что представления агентов о неопределенном параметре попарно различны, но при этом являются общим знанием. Иными словами, имеет место асимметричное общее знание.

Не ограничивая общности, занумеруем агентов таким образом, чтобы их представления возрастали: . Структура возможных равновесий в этой ситуации описывается следующим утверждением.

Утверждение 6.4. В игре «Аккордная оплата труда», для которой , при , равновесными (в зависимости от соотношения между параметрами) могут быть следующие n +1 исходов:

; . Содержательно это означает следующее: либо никто не работает, либо работает один k -йагент, выбирая действие .

Доказательство. Пусть вектор действий y^*=(y ₁^*,…, y_n ^* ) является равновесием (очевидно, при этом для любого ). Пусть существует такое , что y_k ^* > 0. Покажем, что в этом случае .

Действительно, если , то k -йагент не рассчитывает на получение вознаграждения и, следовательно, может увеличить свой (субъективно ожидаемый) выигрыш с отрицательного до нулевого, выбрав нулевое действие. Если же , то k -йагент рассчитывает на получение вознаграждения, однако он может увеличить свой выигрыш, выбрав вместо действие . Таким образом, при k -й агент может увеличить свой выигрыш, что противоречит равновесности вектора y^*.

Мы показали, что, если , то . Но в силу условия , это равенство может выполняться лишь для одного . Поэтому если , то для всех . При этом, очевидно, .

Рассмотрим теперь вопрос о том, при каких соотношениях между параметрами , реализуется каждое из равновесий, перечисленных в формулировке утверждения 6.9. Вектор (0,…,0) является равновесным в случае, когда никакой i -й агент не может собственными усилиями выполнить достаточную (с его точки зрения) для получения вознаграждения работу (либо это усилие составляет в точности , так что выигрыш i -го агента остается нулевым).

Это условие формально записывается следующим образом: для любого i. Вектор является равновесным, если , а все агенты с номерами i > k, считая, что вознаграждения не будет, являются недостаточно эффективными, чтобы собственными усилиями компенсировать величину . Формально: для любого i > k.

Возможные равновесия в игре двух агентов изображены на рис. 6.11. Заметим, что, в отличие от варианта I, существует область, в которой равновесие отсутствует.

Рассмотрим теперь общий случай, когда представления агентов могут и совпадать: . В этом случае может появиться целая область равновесий, аналогично варианту I. Пусть, например, выполняются соотношения при . Тогда при выполнении условий и , равновесным является любой вектор y^*, для которого: , , ; , .

Содержательно это означает, что в равновесии всю работу выполняют агенты, которые одинаково представляют себе необходимый для получения вознаграждения объем работы.

Вариант III. Пусть теперь структура информированности игры имеет глубину 2, но каждый агент считает, что играет в игру с асимметричным общим знанием. В этом случае множество возможных равновесных ситуаций становится максимально возможным: . Более того, справедливо следующее утверждение.

Утверждение 6.5. В игре «Аккордная оплата труда» для любого вектора действий существует такая структура информированности глубины два (при которой каждый агент субъективно играет в игру с асимметричным общим знанием), что вектор у ^* является единственным равновесием.

Доказательство. Достаточно для каждого положить

(здесь - произвольное положительное число) и выбрать любые . Тогда i -й агент ожидает от оппонентов нулевых действий, а его собственным субъективно равновесным действием является .

Замечание 1. Построенное в доказательстве утверждения 6.10 равновесие является (объективно) Парето-эффективным, если сумма равна истинному значению неопределенного параметра .

Замечание 2. Действие является равновесным, если . Однако, при этом равновесным будет и действие - в обоих случаях субъективно ожидаемый i -м агентом выигрыш равен нулю.

Вариант IV. Пусть теперь структура информированности игры имеет глубину два, и на нижнем уровне имеется симметричное общее знание. Иными словами, каждый фантомный агент считает: неопределенный параметр равен , и это общее знание.

Оказывается, что и в этом случае множество равновесных ситуаций является максимально возможным: . Более того, справедливо следующее утверждение.

Утверждение 6.6. В игре «Аккордная оплата труда» для любого вектора действий существует такая структура информированности глубины два с симметричным общим знанием на нижнем уровне, что вектор у ^* является единственным равновесием.

Доказательство. Возьмем любое значение и будем считать, что это значение является общим знанием среди фантомных агентов. Тогда единственным равновесием в игре фантомных агентов является выбор каждым из них нулевого действия.

Далее, для каждого положим:

где - произвольное положительное число. Тогда, как нетрудно видеть, наилучшим ответом i -го агента на ожидаемые им нулевые действия оппонентов является выбор действия y_i^* .

Замечания 1 и 2, сделанные при анализе варианта III, можно повторить дословно и для варианта IV.

Таким образом, мы исследовали структуру информационных равновесий игры «Аккордная оплата труда» при различных вариантах информированности агентов. Полученные результаты полностью подтверждают интуитивно правдоподобный качественный вывод: в коллективе работников совместная работа возможна (является равновесной) лишь в том случае, когда имеется общее знание о том, какой объем работ необходимо выполнить для получения вознаграждения.

Рассмотрим теперь вопрос о стабильности информационного равновесия. Анализ проведем для варианта II, когда имеет место асимметричное общее знание. Будем считать, что в результате игры общим знанием среди агентов становится факт выплаты или невыплаты вознаграждения.

Равновесие (0, …, 0), очевидно, стабильно в любом случае: никто не работает, не ожидает получить вознаграждение и не получает его.

Равновесие вида , в случае возможно, как было показано выше, при , для любого i>k. Тогда i -агенты с номерами ожидают выплаты вознаграждения, а с номерами i>k - не ожидают. Поэтому единственная возможность стабильности - условие k = n. Таким образом, получаем условие стабильности:

(6.21)

Аналогично при стабильным является любой набор

В соответствии с утверждением 6.10, центр может при помощи информационного управления (в частности, путем формирования структуры, при которой каждый агент субъективно играет в игру с асимметричным общим знанием) добиться от агентов любого набора действий . Оказывается, что существует и стабильное информационное управление, обеспечивающее этот результат. Покажем это для .

Пусть задан набор , . Положим для каждого и для каждого возьмем любые ,такие, что . Тогда для i -агента субъективно выполнено условие стабильности (6.21) и - его единственное равновесное действие. При этом

1) работа будет выполнена, и агенты получат вознаграждение;

2) получение вознаграждения будет ожидаемым исходом для всех реальных и фантомных агентов.

Содержательно, ситуация при этом возникает следующая: каждый агент считает, что именно он выполнил всю работу и что это - общее знание.

Коррупция. Рассмотрим следующую теоретико-игровую модель коррупции. Пусть имеются п агентов - чиновников, дополнительный доход каждого из которых пропорционален сумме полученных им взяток , предложение которых будем считать неограниченным, . Пусть каждый из п агентов характеризуется своим типом , и тип агента достоверно ему известен, но не известен остальным агентам. Содержательно тип агента может интерпретироваться как субъективное восприятие им «силы» штрафов.

За коррупционную деятельность (), вне зависимости от ее размера, на агента может быть наложен штраф , зависящий от действий всех агентов и типа данного агента.

Таким образом, целевая функция i -го агента имеет вид:

. (6.22)

Относительно функции штрафов предположим, что она имеет вид:

. (6.23)

Содержательно предположение (6.23) означает, что штраф, накладываемый на i -го агента, зависит от его действия и от агрегированной обстановки (которая может интерпретироваться как «общий уровень коррумпированности остальных чиновников» с точки зрения i -го агента).

Предположим, что число агентов и общий вид целевых функций являются общим знанием, а относительно параметра каждый из агентов имеет иерархию представлений: r_ij - представление i -го агента о типе j -го агента, r_ijk - представление i -го агента о представлениях j -го агента о типе k- гоагента и т.д., .

Предположим также, что агенты наблюдают общий уровень коррумпированности. Поэтому стабильность информационного равновесия будет иметь место при любых представлениях о типах реальных или фантомных оппонентов, таких, что соответствующее информационное равновесие приводит к одному и тому же значению агрегата Q_i (•) для любого .

Тогда, как нетрудно видеть, для целевых функций агентов (6.22), (6.23) выполнены условия утверждения 6.8. Поэтому для любого числа агентов и любой структуры информированности все стабильные равновесия в рассматриваемой игре являются истинными. Таким образом, справедливо следующее

Утверждение 6.7. Пусть набор действий , - стабильное информационное равновесие в игре (6.22), (6.23). Тогда это истинное равновесие.

Следствие. Уровень коррумпированности в стабильной ситуации не зависит от взаимных представлений коррупционеров о типах друг друга. При этом не важно, являются ли сами эти представления истинными или ложными.

Отсюда вытекает, что невозможно повлиять на уровень коррумпированности лишь путем изменения взаимных представлений. Поэтому любое стабильное информационное управление приводит к одному и тому же уровню коррумпированности.

Предположим, что:

, и все типы одинаковы: r ₁=…= r_n = r. Тогда, как нетрудно убедиться, равновесные действия агентов таковы: , а общий уровень коррумпированности составляет .

Изменить последнюю величину можно, лишь повлияв непосредственно на типы агентов.

Биполярный выбор. Рассмотрим ситуацию, когда агенты из бесконечно большой «популяции» осуществляют выбор между двумя альтернативами, которые будем для общности называть позитивным и негативным полюсами. Это может быть кандидат на выборах (голосовать «за» или «против»), продукт или услуга (покупать или нет), этический выбор (поступить «хорошо» или «плохо») и пр.

В силу бесконечности числа агентов будем считать, что при решении задачи управления всей «популяцией» выбор каждого конкретного агента не играет роли, а важна доля агентов, выбирающих позитивный полюс. Иначе это можно сформулировать следующим образом: действием «агрегированного» агента является вероятность x выбора им позитивного полюса.

Примем следующие предположения:

1) существует n различных типов агентов;

2) доля агентов i -го типа составляет ;

3) действие агента i -го типа задается функцией реакции на ожидание:

где p - ожидаемая агентами вероятность выбора позитивного полюса произвольным агентом из «популяции». Иными словами, если агент ожидает, что доля выбравших позитивный полюс составляет p, то его действие x_i определяется следующим образом:

4) пункты 1-3 являются общим знанием среди агентов.

Пусть - действие агента i -го типа. Тогда доля выбравших позитивный полюс составляет: .

Определим равновесие биполярного выбора как набор действий х_i, удовлетворяющих системе соотношений:

. (6.24)

В качестве отступления заметим, что соотношения (6.24) являются одной из возможностей описания биполярного выбора. Другие возможные подходы обсуждаются, например, в работах В.А. Лефевра, ТА. Таран и др. В этих работах предполагается, что принимающий решение агент осуществляет рефлексию первого рода, т.е. занимает позицию наблюдателя по отношению к своему поведению, своим мыслям и чувствам. Иными словами, в нем существует несколько соотнесенных друг с другом уровней, а итоговое решение определяется как влиянием внешней среды, так и состоянием этих уровней. В данной же работе агент понимается как индивид, т.е. «неделимый», и осуществляет рефлексию второго рода - относительно принятия решений оппонентами.

Вернемся к обсуждению равновесия биполярного выбора. Заметим, что выражения (6.24) задают отображение единичного гиперкуба [0, 1] ⁿ на себя:

. (6.25)

Если функции непрерывны (что представляется довольно естественным предположением), то и отображение (6.25) непрерывно. Тогда по теореме о неподвижной точке у системы (6.24) имеется хотя бы одно решение.

Приведем пример. Пусть существуют агенты трех типов (n =3), действия которых определяются следующими функциями:

Содержательно: агенты первого типа независимо ни от чего выбирают позитивный полюс, агенты третьего типа - негативный. Что касается агентов второго типа, то они колеблются, и их действия совпадают с ожидаемым действием «популяции» в целом.

Система (6.24) в данном случае сводится к соотношениям:

откуда (здесь и далее полагаем, что 0< a_i <1, i =1, 2, 3):

При этом:

. (6.26)

Предположим теперь, что некий управляющий орган – центр – имеет возможность повлиять на ситуацию и стремится увеличить вероятность позитивного выбора в «популяции» в целом (т.е. величину p). Для этого центр может повлиять на агентов второй либо третьей группы (агенты первой группы и так выбирают x ₁ = 1). Пусть центр может повлиять на третью группу, переведя долю y ее членов во вторую и затратив некий ресурс (например, финансовый) в объеме C ₂ y. Центр может также повлиять на вторую группу, изменив представления ее членов об a ₃ (независимо от фактического значения этого параметра). Именно, влияние состоит в формировании у второй группы следующего представления: «доля x членов третьей группы перешли во вторую». Затраты на формирование такого представления составляют C ₁ x.

Иными словами, центр может изменить либо реальную, либо «фантомную», воображаемую долю агентов третьего типа. При этом совокупный ресурс (бюджет), которым располагает центр, составляет C.

Задача центра состоит в следующем: распределить ресурс C (т.е. выбрать доли x и y) таким образом, чтобы вероятность p была максимальной. Формально оптимизационная задача центра ставится следующим образом (см. (6.26)):

(6.27)

при ограничениях:

. (6.28)

Легко видеть, что задача (6.27) сводится к максимизации функции , которая возрастает по обоим аргументам x и y, поэтому первое из ограничений (6.28) обращается в равенство. Итак, задача свелась к нахождению максимума функции

Нетрудно видеть, что функция является монотонно возрастающей (соответственно, монотонно убывающей или константой), если выражение:

(6.29)

положительно (соответственно, отрицательно или равно нулю).

Введем обозначения: . Тогда условие положительности выражения (6.29) запишется в виде:

. (6.30)

Далее будем предполагать, что C ₁> C и C ₂> C. Содержательно это означает, что у центра не так много ресурсов, чтобы всех агентов третьего типа «превратить» в агентов второго типа. При этом оптимальным будет такой выбор центра, когда весь ресурс вкладывается в увеличение либо реальной, либо воображаемой (при выполнении (6.30)) доли агентов второго типа.

Зависимость оптимального выбора центра от параметров изображена на рис. 6.12.

На рис. 6.12 заштрихована область, где выполнено условие (6.30), т.е. оптимально для центра весь ресурс направить на изменение представлений:

. (6.31)

Решение (6.31) отвечает ситуации, когда доля a ₂ агентов второго типа достаточно велика. Из рис. 6.12 видно, что если , то решение (6.31) всегда оптимально. Если же:

, (6.32)

то решение (6.31) оптимально при достаточно больших a ₃. Содержательно последний случай означает следующее: при некотором диапазоне значений параметра a ₂ (т.е. при выполнении (6.32)) оптимально влиять на представления, когда они слишком пессимистичны (т.е. когда a ₃ достаточно велико и, следовательно, велика вероятность p выбора негативного полюса).

В заключение отметим, что рассмотрен простейший случай информационного управления в условиях биполярного выбора. Дальнейшее развитие модели (увеличение числа типов агентов, усложнение структуры информированности, усложнение функций реакции на ожидание) и ее сопоставление с наблюдаемыми результатами действий экономических (покупатели) и политических (избиратели) агентов представляется перспективным направлением дальнейших исследований.

Реклама товара. В настоящем подразделе рассматриваются модели информационного управления, осуществляемого средствами массовой информации (СМИ), на примере рекламы и предвыборных технологий.

Предположим, что имеется агент – объект информационного воздействия. Цель воздействия – сформировать у агента определенное отношение к конкретному объекту или субъекту.

В случае рекламы агентом является потребитель, а объектом – товар или услуга. Требуется, чтобы потребитель приобрел данный товар или услугу.

В случае предвыборных технологий агентом является избиратель, а субъектом – кандидат. Требуется, чтобы избиратель проголосовал за данного кандидата.

Рассмотрим i -го агента. Всех остальных агентов объединим в одного, для обозначения которого будем использовать индекс j. Пусть – объективная характеристика объекта, неизвестная достоверно ни одному из агентов. В качестве характеристик могут выступать потребительские свойства товаров, качества кандидатов и т.д.

Обозначим – представления i -го агента об объекте, – его представления о представлениях об объекте j -го агента, и т.д.

Предположим для простоты, во-первых, что множество возможных действий каждого агента состоит из двух действий: X_i=X_j={a; r }, где действие a (accept) соответствует приобретению товара или услуги, голосованию за рассматриваемого кандидата и т.д., а действие r (reject) - отказу от приобретения товара или услуги, голосованию за других кандидатов и т.д. Во-вторых, предположим, что множество состоит из двух элементов, характеризующих качества объекта - g (good) и b (bad), то есть .

Рассмотрим последовательно (в порядке усложнения) ряд моделей поведения агента.

Модель 0 (рефлексия отсутствует). Предположим, что поведение рассматриваемого агента описывается отображением множества свойств объекта во множество X_i действий агента, то есть B_i: . Примером такого отображения может служить следующее: B_i(g)=a, B_i(b)=r, то есть если агент считает, что товар (кандидат) хороший, то он его приобретает (отдает за него свой голос), и отвергает в противном случае.

В данной модели информационное управление заключается в формировании у агента представлений об объекте, приводящих к требуемому выбору. В рассматриваемом примере для того, чтобы агент приобрел товар (проголосовал за требуемого кандидата), необходимо сформировать у него следующие представления: . (Напомним, что в настоящей работе технологии информационного воздействия (то есть способы формирования требуемых представлений) не рассматриваются.)

Модель 1 (первый ранг рефлексии). Предположим, что поведение рассматриваемого агента описывается отображением множеств свойств объекта и - представлений агента о представлениях других агентов - во множество X_i его действий, то есть B_i: . Примерами такого отображения могут служить следующие:

B_i(g, g)=a, B_i(g, b)=a, B_i(b, g)=r, B_i (b, b)=r,

B_i(g, g)=a, B_i(g, b)=r, B_i(b, g)=a, B_i(b, b)=r.

В первом случае агент ориентируется на собственное мнение, во втором - на мнение других агентов («общественное мнение»).

В данной модели информационное воздействие является рефлексивным управлением. Посредством него у агента формируются представления об объекте и о представлениях других агентов, приводящих к требуемому выбору. В рассматриваемом примере для того, чтобы агент приобрел товар (проголосовал за требуемого кандидата), необходимо в первом случае сформировать у него следующие представления: - любое, а во втором случае - - любое.

Следует подчеркнуть, что в информационном управлении посредством СМИ не всегда воздействие направлено на формирование непосредственно - в большинстве случаев воздействие осуществляется косвенно - у агента формируются представления о поведении (выбираемых действиях) других агентов, по которым данный агент может восстановить их представления. Примерами косвенного формирования представлений могут служить рекламные лозунги «Новое поколение выбирает Pepsi», «В то время, когда все настоящие мужики …», обращение к мнению авторитетных людей и т.д.; информация о том, что по опросам общественного мнения значительное число избирателей собирается поддержать данного кандидата и т.д.

Модель 2 (второй ранг рефлексии). Предположим, что поведение рассматриваемого агента описывается отображением множеств , свойств объекта, - представлений агента о представлениях других агентов и - представлений агента о представлениях других агентов о его собственных представлениях - во множество X_i его действий, то есть B_i: . Примером такого отображения, в котором проявляются отличные от нулевой и первой моделей свойства, может служить следующее:

В данном случае агент следует своей «социальной роли» и производит выбор, которого от него ожидают другие агенты.

В рассматриваемой модели информационное воздействие является рефлексивным управлением и заключается в формировании у агента представлений о представлениях других агентов о его собственных представлениях, приводящих к требуемому выбору. В рассматриваемом примере для того, чтобы агент приобрел товар (проголосовал за требуемого кандидата), необходимо сформировать у него следующие представления: .

Следует подчеркнуть, что информационное воздействие не всегда направлено на формирование непосредственно - в большинстве случаев воздействие осуществляется косвенно: у агента формируются представления о том, что другие агенты ожидают от него определенных действий. Речь идет о так называемом социальном влиянии, многочисленные примеры которого можно найти в учебниках по социальной психологии.

Примерами косвенного формирования представлений могут служить лозунги «Ты записался добровольцем?», «А ты купил (сделал) …?», «В Вашем положении (при Вашем статусе)…?» и т.д.; информация о том, что по опросам общественного мнения большинство представителей социальной группы, к которой принадлежит (или с которой идентифицирует себя) агент, собирается поддержать данного кандидата и т.д.

Таким образом, мы рассмотрели простейшие модели информационного управления посредством СМИ, сформулированные в терминах рефлексивных моделей принятия решений и структур информированности. Во всех этих моделях ранг рефлексии не превышал двух (исключением является, наверное, очень редко встречающаяся на практике ситуация, когда информационное воздействие направлено на формирование сразу всей информационной структуры, например путем навязывания «общего знания» – «Голосуй сердцем!», «… – наш выбор!» и т.д.).

Представить себе реальные ситуации, в которых информационное воздействие направлено на более глубокие компоненты структуры информированности, затруднительно. Поэтому перспективным направлением дальнейших исследований является изучение формальных моделей информационного управления (и технологий этого управления) агентами, осуществляющими коллективное принятие решений в условиях взаимосвязанной информированности.

Предположим теперь, что имеется два типа агентов: агенты первого типа склонны приобретать товар независимо от его рекламы, агенты второго типа в отсутствии рекламы приобретать товар не склонны. Обозначим – долю агентов первого типа.

Агенты второго типа, доля которых есть , подвержены влиянию рекламы, но не осознают этого. Социальное влияние отразим следующим образом: будем считать, что агенты второго типа с вероятностью выбирают действие a и с вероятностью 1 – выбирают действие r. Зависимость – вероятности выбора – от доли агентов, склонных приобретать товар, отражает нежелание агентов быть «белыми воронами».

Если истинная доля агентов первого типа является общим знанием, то агенты ожидают, что именно агентов приобретут товар, а фактически наблюдают, что товар приобрели:

(6.33)

агентов (напомним, что мы предположили, что влияние рекламы не осознается агентами). Так как , то косвенное социальное влияние оказывается самоподтверждающим - «Смотрите, оказывается, склонны приобретать товар больше людей, чем мы считали!».

Проанализируем теперь асимметричную информированность. Так как агенты первого типа выбирают свои действия независимо, то можно считать их адекватно информированными как о параметре , так и о представлениях агентов второго типа.

Рассмотрим модель информационного регулирования, в которой центр, проводящий рекламную акцию, формирует у агентов второго типа представления о значении параметра .

Сделав маленькое отступление, обсудим свойства функции . Будем считать, что - неубывающая на [0; 1] функция, такая, что , где и - константы, принадлежащие единичному отрезку, такие, что . Содержательно соответствует тому, что некоторые агенты второго типа «ошибаются» и, даже если считают, что все остальные агенты имеют второй тип, то приобретают товар. Константа характеризует в некотором смысле подверженность агентов влиянию - у агента второго типа имеется шанс быть самостоятельным и, даже если он считает, что все остальные агенты приобретут товар, отказаться от покупки. Частный случай соответствует независимым агентам второго типа, отказывающимся от приобретения товара.

Так как агенты не подозревают о наличии манипуляции со стороны центра, то они ожидают увидеть, что агентов приобретут товар. Фактически же его приобретут:

. (6.34)

Если доход центра пропорционален доле агентов, приобретающих товар, а затраты на рекламу являются неубывающей функцией , то целевая функция центра (разность между доходом и затратами) в отсутствии рекламы равна (6.33), а в ее присутствии:

. (6.35)

Следовательно, эффективность информационного регулирования можно определить как разность между (6.35) и (6.33), а задачу информационного регулирования записать в виде:

. (6.36)

Обсудим теперь ограничения задачи (6.36). Первое ограничение: , точнее: .

Рассмотрим пример: пусть , где r> 0 - размерная константа. Тогда задача (6.36) имеет вид:

. (6.37)

Решение задачи (6.37) имеет вид: , т.е. при информационное регулирование для центра не имеет смысла (затраты на рекламу не окупаются, так как достаточная доля агентов приобретает товар в отсутствие рекламы).

Наложим теперь дополнительно к требование стабильности информационного регулирования, а именно, в предположении наблюдаемости доли агентов, приобретающих товар, будем считать, что агенты второго типа должны наблюдать значение доли агентов, приобретающих товар, не меньшее, чем им сообщил центр, то есть условие стабильности имеет вид: .

Подставляя (6.34), получим:

. (6.38)

Следовательно, оптимальным стабильным решением задачи информационного регулирования будет решение задачи максимизации (6.36) при ограничении (6.38).

В заключение настоящего раздела отметим, что в рассматриваемом примере любое информационное регулирование будет стабильным в смысле (6.38). Если же понимать под стабильностью полное совпадение ожидаемых и наблюдаемых агентами результатов (то есть потребовать выполнение (6.38) как равенства), то единственным стабильным информационным регулированием будет сообщение центра, что все агенты являются агентами первого типа, то есть (что чаще всего и имеет место в рекламе).

Качественное обсуждение. Методы информационного управления, описанные в настоящей главе, являются наиболее тонкими, изощренными, «рискованными» по сравнению с прочими, поскольку информированность (мнения, убеждения) обычно смоделировать сложнее, чем, например, оргструктуру организации или даже мотивационную структуру субъекта. Более того, методы информационного управления могут применяться как «надстройка» над любыми другими методами, так как в результате применения управления в организационной системе формируется равновесие, зависящие от информированности всех участников системы. А воздействие на структуру информированности может позволить управлять равновесием, повышая эффективность функционирования системы с точки зрения лица, принимающего решения.

В рамках принятой в рефлексивных играх модели принятия решений действия агента определяются не чем иным, как его информированностью о состоянии природы и представлениях оппонентов (других агентов). Поэтому весьма важным является вопрос о том, каким образом информационные воздействия центра влияют на эти представления. Иными словами, вопрос состоит в следующем: как формируется информационная структура игры в зависимости от тех или иных информационных воздействий центра.

Здесь необходимо признать, что сколько-нибудь исчерпывающий ответ на этот вопрос, по видимому, невозможно получить, оперируя исключительно математическими (и, в частности, теоретико-игровыми) моделями. Это обусловлено в первую очередь тем, что процесс усвоения человеком той или иной информации в очень большой степени обусловлен факторами социально-психологического порядка. «Секрет высокоэффективного информационного управления – обращение к бессознательному, в использовании приемов снятия барьеров восприятия и преодоления естественной толерантности человека к восприятию нового».

Понятно, с какими трудностями связана формализация этого процесса, когда речь идет о принятии решения умным и рациональным агентом (intelligent rational decision-maker) – «главным героем» работ по теории игр. Все разработанные на данный момент концепции решения игры основываются, явно или неявно, на уже существующей к моменту начала игры структуре информированности. Что было «до начала игры», как сложилась та или иная информированность – этот вопрос остается за рамками обсуждения. По-видимому, здесь проходит некая граница между реальным человеком и модельным «умным рациональным агентом».

Выше была приведена классификация информационных воздействий.

Напомним пример, ставший основой модели «Принцип дефицита» (см. раздел 6.4). Описан психологический эксперимент, проведенный изучавшим психологию бизнесменом, владельцем компании, импортирующей в США говядину. «Торговые агенты позвонили, как обычно, постоянным клиентам компании – закупщикам говядины для супермаркетов и других точек, торгующих продуктами в розницу, и одним из трех способов предложили им сделать заказ. Одни клиенты услышали предложение, сделанное в стандартной форме. Другим клиентам дополнительно была предоставлена информация о том, что поставки импортной говядины будут сокращены в ближайшие несколько месяцев. Третья группа клиентов получила те же сведения, что и вторая группа, а также информацию о том, что мало кто узнает о предстоящем сокращении поставок, так как эти сведения поступили из надежного, но засекреченного источника.

В этом примере отчетливо видно осуществление информационного регулирования («поставки импортной говядины будут сокращены») и рефлексивного управления («поставки импортной говядины будут сокращены… мало кто узнает о предстоящем сокращении поставок»).

Приведем пример активного прогноза. Описывается следующий эффект. «Вечером 6 января 1981 года Джозеф Гранвилл, известный советник по капиталовложениям во Флориде, отправил своим клиентам телеграмму: «Цены на акции резко упадут; продавайте завтра». Очень скоро все узнали о совете Гранвилла, и 7 января стало самым черным днем во всей истории Нью-йоркской фондовой биржи. По общему мнению, акции потеряли в цене около 40 миллиардов долларов».

Еще пример активного прогноза: «Если влиятельные эксперты, выполняя заказ главы государства, находящегося в конфликтных отношениях с высшим органом законодательной власти, спрогнозировали неизбежность досрочного роспуска парламента, то это могло подвигнуть заказчика именно к такому развитию событий, хотя реально оставались возможности для реализации иного сценария».

На сегодняшний день существует несколько трактовок терминов «рефлексия» и «рефлексивное управление», в том числе, в рамках подходов школы В.А. Лефевра и др.

Успешность практического применения методов информационного управления в решающей степени зависит от адекватности моделей

1) текущей информированности агентов;

2) зависимости информационной структуры от сообщений (и иных действий) центра.