Премьер-министр и медсотрудник. Ловушки наложения четких целей на беспорядочный мир

За десять лет в роли британского премьер-министра Тони Блэр хотел улучшить результаты деятельности Государственной службы здравоохранения (NHS). NHS представляет собой огромную организацию, оказывающую услуги здравоохранения и финансируемую правительством. Теоретически британские избиратели обожают ее за то, что она предоставляет бесплатные услуги всем, но на практике недолюбливают за медлительность и спорное качество услуг, так как лечение порой несистематичное и осуществляется медленно. Мистер Блэр сделал NHS политическим приоритетом и, чтобы контролировать работу организации, ввел систему требований. Одно из них предписывало, чтобы пациенту после обращения к своему доктору назначали прием в течение 48 часов.

Последствия вскоре отрикошетили прямо в премьер-министра. В течение предвыборной кампании 2005 года красноречивый Блэр оказался в сложном положении, когда столкнулся с обычным избирателем в телевизионной дискуссии. Жалоба Дианы Черч была простой: ее доктор отказался назначать встречу в течение недели. «Утром приходится по три часа висеть на телефоне в попытках записаться на прием, так как доктору не разрешено назначать визиты раньше», — сетовала она, глядя на растерянного премьер-министра. Затем объяснилась.

Миссис Черч и ее доктор нашли слабое место в системе, которое проглядел Блэр. Доктор может увеличить свои шансы выполнить план по 48-часовому ожиданию, если книга записей будет нетронутой. Каждая заблаговременная запись на прием была потенциальным препятствием для неотложных случаев, поэтому предварительные назначения попросту запретили. В итоге каждый пациент должен был звонить в клинику, ждать на линии и надеяться, что ему повезет, — каждый день. Те, кто дозванивался, практически всегда записывались на прием в течение 48 часов. Тем, кому не повезло, визит не назначался, так как их запрос попросту не принимали. Врачи выполняли план, хотя такое качество обслуживания никуда не годилось.

Когда Блэр предположил, что опыт миссис Черч, по-видимому, был уникален, ведущий программы повернулся к зрителям и спросил, кто еще сталкивался с подобными проблемами. Треть зрителей подняли руки.

Нервничая, Блэр сказал, что «очевидно, все должно работать по-другому»[213].

Очевидно.

В 1763 году на территории современной Германии человек по имени Иоганн Готлиб Бекман собрал команду рабочих. Он предоставил им специальные пояса с инструментами: на каждом поясе имелось пять кожаных мешочков, в которых находилось определенное количество гвоздей разных цветов. Рабочие выстроились в линию и медленно пошли по дикому лесу, держась друг друга и исследуя окружающую среду, словно искали потерянные ключи или тело убитой жертвы.

Мужчины пытались посчитать и оценить каждое дерево, мимо которого проходили. Всем деревьям был присвоен размер от 1 до 5. В каждое дерево они вбили цветной гвоздь, отражающий размер. Когда рабочие закончили свой скрупулезный марш сквозь плотный лесной массив, они подсчитали количество оставшихся гвоздей. С помощью простой арифметики можно было узнать, сколько деревьев и какого размера росло в густом лесу[214].

Леса хаотичны. Если ваш интерес к лесу ограничивается лишь прогулками, то хаос может показаться очаровательным. Разница почв и уклона, места падения солнечных лучей и тени, шрамы прежних пожаров означают, что древние лесные массивы являются смесью деревьев разных размеров: одни скрюченные и потрепанные непогодой, другие зажаты мелколесьем, третьи стройные, разлапистые и раскрашенные солнечными лучами. Однако если ваш интерес к лесу продиктован выгодой с продаж древесины или взиманием налогов на ее стоимость, хаос мешает рассмотреть важные показатели. В беспорядочном лесу сложно подсчитать деревья или сравнить одно дерево как потенциальный источник древесины с другим. Иоганн Готлиб Бекман выполнял задание по приведению леса в порядок.

Правительства продолжают пропагандировать идею о том, что чем лучше мы изучим мир, тем лучше сможем контролировать и использовать его. К ним присоединились корпорации, которые также видят смысл в количественном определении и классификации объективной реальности. От снимков с высоким разрешением, сделанных дронами и спутниками, фотографий и твитов с геотегами до мобильных телефонов, постоянно передающих информацию о геолокации в колоссальные базы данных, и «интернета вещей» (теория о том, что большинство объектов вокруг нас скоро сможет сообщать свое местонахождение и статус) — мы продолжаем бродить по Земле, измерять окружающую среду и вбивать виртуальные цветные гвозди.

Проблема заключается в том, что когда мы начинаем измерять и подвергать количественной оценке все вокруг, то вскоре изменяем мир до состояния, соответствующего нашим оценкам.

Вначале лесничие-исследователи ограничивались интегральными вычислениями и экспериментами с поленницами, чтобы подсчитать объем древесины в Normalbaum, или «стандартном дереве». Интерес в первую очередь представлял объем древесины. Однако вскоре были упорядочены не только карты лесов и списки по выходу древесины. Из старых чащ тоже начали изгонять хаос. Сбивающую с толку мешанину деревьев различных возрастов и видов заменили на рассадки определенных видов (популярной стала ель обыкновенная) и определенного возраста. Лесники высадили саженцы в ряд, чтобы упростить исследования, поддерживать порядок и вести лесозаготовки в установленное время. Погибшие деревья вырубались, гниющие стволы убирались, поросль подчищали. Термин Normalbaum, который когда-то был статистически удобной идеализацией дерева, обрел физическую форму. Леса в конечном счете стали напоминать абстракции, изображенные на картах.

Процесс стал важным и прибыльным. А как иначе? Раньше леса представляли собой трудноизучаемый хаос. Теперь и деревья, и описывающие их статистические таблицы были оформлены в аккуратные строчки и столбцы. А вот местные крестьяне многого лишились: нельзя было больше разрубить на дрова упавшее дерево, собрать сок, чтобы изготовить клей, лекарства и материалы для растопки, или желуди для свиней — многие ресурсы, не вписывающиеся в метрики, были больше недоступны. А поскольку их вообще не регистрировали, то и лишения крестьян не принимались в расчет.

Официальные показатели и планы никогда не смогут количественно выразить хаотичную реальность мира в полной мере, но могут его изменить. А поскольку нет идеальных систем измерения, такие перемены могут быть к худшему.

План Тони Блэра касательно NHS был навязан чиновниками, а научное лесоведение Бекмана воплощало власть государства и стоящих за ним крупных землевладельцев. Иногда, однако, лишь возможности подсчитывать и измерять бывает достаточно, чтобы спровоцировать гонку вооружений.

Рассмотрим шкалу Апгар. В больницах по всему миру приблизительно через минуту после рождения ребенка медсестра или акушерка может с одного взгляда оценить его состояние по десятибалльной шкале. Шкала Апгар включает в себя два балла за розовый цвет кожи, два балла за плач, два балла за бодрый пульс и т. д. Ее в начале 1950-х годов разработала американский анестезиолог Вирджиния Апгар, и это никоим образом не абсурдная методика, а быстрый и удобный способ оценки здоровья новорожденного: ребенку с низким баллом, вероятно, вскоре понадобится помощь врачей[215].

Но так как шкала Апгар обеспечивала точную количественную оценку, ее введение привело к неожиданным последствиям. Как объясняет Атул Гаванде в статье New Yorker, шкала Апгар «превратила неосязаемую и субъективную клиническую концепцию — состояние новорожденного — в цифры, которые люди могут собирать и сравнивать».

Группа врачей с соревновательной жилкой захотела улучшить свои показатели. Администраторы больниц также начали проявлять интерес к оценкам по шкале Апгар. «Когда заведующие акушерских отделений начинали изучать показатели по шкале Апгар в журналах своих докторов и акушерок, они уподобились управляющим хлебозавода, анализирующим, сколько буханок испекли их пекари, — пишет Гаванде. — Администрации больниц искали решение, которое поднимет результаты каждого сотрудника: от новичка до самого опытного. А это значит, что для красивых показателей будут прибегать к надежным, проверенным решениям, с которыми, однако, в медицине не всегда можно добиться блестящих результатов».

Сложные процедуры вроде манипуляций со щипцами сменились кесаревым сечением, результаты которого были более предсказуемы: брюшную полость матери вскрывали для извлечения ребенка. Роды, выполненные надлежащим образом с использованием щипцов, могут избавить мать от серьезного хирургического вмешательства. Но кесарево сечение — простой, рутинный метод, которому легко научиться. Это выверенный, шаблонный подход, так как независимо от причины, по которой ребенок упорно не хочет выходить на свет, кесарево сечение позволит его извлечь. Подобные операции теперь осуществляются примерно с третью всех рожениц в США и четвертью — в Великобритании, и это несмотря на мнение медицинских экспертов, которые полагают, что лишь 10-15% всех родов требуют такого вмешательства[216]. Это «логика заводского цеха», и она вошла в практику после того, как простой показатель стал доступен «руководителям завода». Но кесарево сечение — испытание для матерей, которых никто не оценивает по шкале Апгар, но им все равно приходится восстанавливаться после вскрытия брюшной полости. Популяризация этого метода определенно не входила в планы Вирджинии Апгар[217].

Или давайте задумаемся над тем, что произошло в начале 1990-х, когда Нью-Йорк и Пенсильвания ввели систему карточек отчетности с публично доступной информацией о том, как продвигалось лечение у определенных врачей в определенных больницах. В отличие от шкалы Апгар, которая предназначалась для облегчения диагностики врачами-профессионалами, карточки отчетности были созданы, чтобы пациенты могли узнать, может ли их доктор отличить один конец стетоскопа от другого. Система американского здравоохранения построена на возможности пациентов выбирать предпочитаемых терапевтов, что подразумевает доступ к данным для осознанного выбора. Сообщая пациентам, страховым компаниям и врачам общей практики результаты работы определенных специалистов, карточки успеваемости должны были наградить опытных, наказать некомпетентных и предоставить обеим категориям стимулы для самосовершенствования.

Есть множество способов выиграть игру, и далеко не все они, к сожалению, подразумевают уважение к правилам. Четыре экономиста Дэвид Дранов, Дэниел Кесслер, Марк Макклеллан и Марк Саттертуэйт изучили воздействие карточек отчетности на пожилых пациентов, которые перенесли сердечный приступ. Результаты были неутешительными. Врачи избегали оперировать пациентов с серьезными прогнозами, предпочитая тех, кто вовсе не нуждался в хирургическом вмешательстве.

В рамках логики карточек отчетности это имеет смысл. В конце концов, какой компетентный кардиохирург захочет оперировать очень больного пациента, который может умереть и испортить ему рейтинг? И наоборот, кто с большей вероятностью оправится, если не пациент, который и до операции чувствовал себя неплохо?[218]

Дранов и его коллеги пришли к выводу, что в целом система карточек отчетности вынуждала хирургов проводить более дорогостоящее лечение, но и состояние пациентов в результате ухудшалось. Как сказал бы Тони Блэр, очевидно, все должно работать иначе.

Требование Блэра относительно времени ожидания заставляло врачей общей практики отклонять несрочные вызовы. Научное лесоводство сократило биологическое разнообразие и негативно сказалось на благосостоянии крестьян. Шкала Вирджинии Апгар для новорожденных побуждала акушеров выполнять больше кесаревых сечений. Карточки отчетности заставили кардиохирургов оперировать сердца пациентов, которые в этом не нуждались. В каждом случае попытки измерить результаты деятельности, а порой и сформулировать четкий целевой показатель имели неожиданные и нежелательные последствия.

Три примера из указанных выше связаны с системой здравоохранения, и это не случайность: медицинское обслуживание обычно серьезно контролируется и предполагает достаточно четкие диагнозы (Сколько мне осталось ждать? Я умру?), за которыми скрываются запутаннейшие схемы и системы. Однако схожие проблемы есть и во многих других областях.

К примеру, ежегодно сайт U.S. News & World Report (USNWR) составляет рейтинг лучших университетов США. Распространенным показателем подобных рейтингов является то, насколько избирательно то или иное учебное заведение: в конце концов, если там отклоняется множество заявок абитуриентов, разумно предположить, что он популярен и следует высоким стандартам. Но так как администрация каждого университета хочет поднять рейтинг учреждения, то лазейка с показателем избирательности может быть (и будет) использована.

Так, Северо-Восточный университет в Бостоне в 2012 году разослал 200,000 индивидуальных писем старшеклассникам, а затем ответил на эти письма 6-8 электронными сообщениями — все это привело к увеличению числа полученных заявок. Затем он смог отклонить десятки тысяч заявок, повысить свою избирательность и таким образом подняться в рейтинге USNWR[219].

Еще более простой техникой является использование национальной стандартизированной формы, которая позволяет студентам подать заявки в несколько учреждений одновременно; при этом заполняется единая электронная анкета и отправляется в разные учебные заведения. Некоторые университеты, включая Чикагский, какое-то время противостояли подобным играм, но затем их уровень избирательности упал. Когда Чикагский университет начал с 2007 года принимать стандартизированные заявки, тысячи студентов, не имевших никакой надежды поступить, могли подать заявку одним кликом мышки. Уровень зачисления в университет упал, а показатель избирательности взлетел, повышая тем самым рейтинг[220].

В Великобритании высшие учебные заведения получили свою лазейку — Систему качества исследований, созданную для измерения качества проведенных академических исследований и выделения государственных средств лучшим ученым. Факультет университета мог приписать себе исследования, проведенные ученым с частичной занятостью, которая подразумевала лишь 20% часов полной занятости. Выгодная сделка, которую администрация вузов быстро включила в свою практику. Исследование Times Higher Education показало, что за два года британские университеты увеличили свой штат сотрудников с часовой занятостью в 20% от полной ставки практически до 2/3. Например, Бирмингемский университет недавно получил статус заведения, проводящего лучшие исследования в области философии: скептики отмечали, что некоторые из сотрудников были первоклассными учеными, проводившими основную часть времени в Гарварде и Нью-Йоркском университете[221].

Перейдем от научных кругов к событиям международного масштаба. В «Декларации тысячелетия» ООН изложен широкий спектр целей, одобренных странами-членами в 2000 году. Изначально предполагалось, что они будут вдохновлять на борьбу с бедностью в самых нищих странах мира, однако их вскоре стали использовать как систему ранжирования для отправки денежных средств в регионы, что привело к возникновению диспропорций[222]. Самой известной стала цель вдвое сократить крайний уровень нищеты в каждой стране мира. Оказалось, что это проще сделать в стране со средним уровнем доходов, например Болгарии или Мексике, где уровень крайней нищеты может равняться лишь 2%, чем в нуждающейся, где этот показатель составляет 20%. Подобно Брайану Ино, который когда-то сознался в том, что изучал список стратегий и выбирал наименее сложную, Цели развития тысячелетия представляли собой список простых и комплексных целей — и давали источникам финансирования поводы лишать поддержки страны с наиболее серьезными проблемами (рассудительных жертвователей такие поводы не убеждали, однако постыден сам факт существования последних).

Что объясняет все эти проблемы, которые возникли из-за практичных исследований? Фундаментальная причина была хорошо изложена в статье 1975 года, выпущенной в Academy of Management Journal и озаглавленной «Безрассудно награждать за “А”, надеясь на “Б”»[223]. Очевидно, что легко допустить ошибку, установив неверную цель. Однако почему так легко оступиться? Почему нельзя просто сделать правильный выбор?

В 1995 году Питер Смит, экономист из Йоркского университета, попытался составить исчерпывающий список всех обстоятельств, в которых постановка целей могла привести к неожиданным последствиям. Это целый массив потенциальных бедствий[224].

Первый источник неприятностей — тот факт, что цели чаще всего просты, в то время как мир является сложным. Любое конкретное явление, поддающееся количественной оценке, вероятно, неспособно отразить хаотичный порядок вещей. Шкала Апгар — отличный пример: она не является единственной важной системой характеристик новорожденного, но из-за простоты в обращении возрастает и ее значимость. Легче посчитать деревья в лесу, чем измерить биоразнообразие.

Или рассмотрим водителя автобуса, который получает вознаграждение за следование расписанию и который придерживается графика времени, проезжая мимо пассажиров без остановки. Все эти случаи являются примерами туннельного зрения — следствием слишком узкой постановки показателей или цели.

В худшем случае цель может быть не только слишком узкой, но и откровенно ошибочной. Исследование Дэвида Дранова в области карточек отчетности кардиологов в Нью-Йорке и Пенсильвании наглядно показывает это. Предполагалось, что карточки будут использованы для оценки того, хорошо ли хирург проводит операцию по коронарному шунтированию, но в них не обязательно записывалось состояние пациента до операции. Пациенты могли неверно истолковать показания, и хирурги сосредоточились на том, что позволяло удерживать их рейтинги, т. е. на поиске здоровых пациентов, а не на совершенствовании навыков. При этом ирония заключалась в том, что когда статистики Харви Голдштейн и Дэвид Шпигельхалтер взглянули на данные по карточкам, они пришли к выводу, что главный определяющий фактор уровня выживаемости пациентов был не навык хирурга — все они были одинаково хороши, — а чистое везение. У конкретного врача мог быть самый высокий показатель смертности в текущем году, а в следующем — один из самых низких[225].

Подобная зашоренность может относиться к временному периоду. Это приводит к политике недальновидности, когда долгосрочные инвестиции приносятся в жертву краткосрочной цели. Например, руководитель может сэкономить на обучении или обслуживании либо просто задерживать выплаты. В краткосрочной перспективе прибыли вырастут, в долгосрочном компанию ждут убытки. Мудрый руководитель это понимает, но все равно может быть заинтересован в выполнении цели. Тогда в силу вступает эффект силосной башни, при котором одна команда добивается целей любым путем, пусть даже нарушая работу других отделов. И в каждом случае нам кажется, что один показатель может объяснить нам все. Это заблуждение. Мы достигаем цели, но упускаем самое главное.

Порой цель отражает вчерашние, а не сегодняшние проблемы. Мир склонен меняться быстрее, чем поспевает бюрократический аппарат, и это служит причиной проблем для любой организации, которая заставляет себя следовать непреклонной системе показателей эффективности. Представьте компанию, которая поставила цель урегулировать вопросы клиентов, звонящих в кол-центр, но не указала, что проблему можно решить с помощью сайта. Есть требование, чтобы ресурсы были направлены в кол-центр, когда их лучше использовать для веб-ресурса. Любому, кто действительно хочет решить проблему, придется игнорировать цель.

Существует два других способа полностью проигнорировать цель — ложь и обман. Иногда можно солгать, что ты достиг результата, хоть на деле все обстоит наоборот, — и это уже выглядит нехорошо. Но обман, при котором вы идете на все, чтобы добиться цели, возможно, даже хуже. Врачи общей практики, которые отказывались назначать предварительные приемы, обманывали Тони Блэра. Пациенты могли получить лучшее обслуживание, если бы доктора просто проигнорировали требование и солгали о нем, если бы их спросили.

В данном контексте можно рассмотреть конкретный эпизод из истории британской Государственной службы здравоохранения, когда плохо поставленная цель стала причиной практически каждого неожиданного последствия из списка Питера Смита.

Задачу впервые обрисовали в 1990-е годы, а в начале XXI века она приобрела политический окрас. Целью было сокращение времени реагирования служб скорой помощи на экстренные вызовы. Когда таковой исходил из городского района и случай был оценен как «смертельно опасный», цель становилась активной: у скорой помощи было 8 минут, чтобы прибыть на место.

Вскоре появились неожиданные последствия.

Самым очевидным была ложь. Ее несложно заметить, если сведения о времени зарегистрированного звонка вносятся в график. В нем отражено равномерное распределение реакций. Затем происходит нечто удивительное[226]. Кривая в графике резко растет на 7 минутах и 50 секундах, достигая невообразимо высокого показателя на 7 минутах 59 секундах и поднимается еще выше до 8 минут ровно. Но вот же удивительное совпадение — практически отсутствуют звонки с реакцией, занявшей 8 минут 1 секунду. Постфактум кто сможет возразить обрабатывавшему вызовы оператору, который сообщит, что скорая приехала вовремя, а не опоздала на 1-2 секунды?

Смертельной опасности такая ложь не таит, так как она не повлияет на то, что в действительности делает бригада скорой помощи. Но другие ответы на постановки целей не настолько безобидны — они связаны с обманом, изменяющим поведение скорой помощи таким образом, чтобы облегчить достижение цели, но который также может нанести вред пациентам.

Одной из проблем стало то, что «в течение восьми минут» оказалось слабой заменой «как можно быстрее». Представьте скорую помощь на пути к пациенту, и часы отсчитывают минуты. Прошло шесть минут, затем семь. Затем проходит восемь минут, и цель оказалась не достигнута — или нарушена, как сказали бы многое повидавшие профессионалы. Что теперь нужно делать? Логика условий диктует, что скорая помощь должна быть перенаправлена к пациенту, в отношении которого нарушений графика пока не отмечалось. Первоначальный пациент больше не имеет смысла как объект для выполнения задачи. Он может ждать бесконечно долго. Лучшая защита против подобного злоупотребления — это надежда на то, что профессиональные бригады скорой помощи проигнорируют цель, но это не с самой лучшей стороны говорит о ее смысле.

Другой серьезный обман включает в себя определение «смертельно опасного» случая. Оно разнится от одной региональной службы к другой, чем можно легко манипулировать. Цель побуждает оператора службы сообщить, что звонок не был срочным, — в этом случае они будут избавлены от записи о нарушении.

Службы скорой помощи даже сменили свои транспортные средства, чтобы выполнить показатели. Два медработника из машины скорой помощи могут разделиться и отправиться на мотоциклах или даже велосипедах. В таком случае медработник с большей вероятностью уложится в восемь минут, но если пациента понадобится отправить в больницу, велосипед делу не поможет.

Имеют место также обвинения в политике недальновидности. Команды скорой помощи жаловались: вместо того чтобы базироваться в больнице, их отправляют на их же собственном транспорте в неудобные точки, где они пережидают ночь и откуда могут быстрее попасть на станции скорой помощи. Качество обслуживания пациентов в краткосрочной перспективе можно улучшить, однако пострадает моральный дух бригады.

Наконец, утверждение, которое стало широко распространено, но так и не было доказано, гласило, что менеджеры перемещают службы скорой помощи в городские районы, где цели сложнее выполнить, из сельских районов, где критерии были другими. В задаче не подразумевалась передача предпочтений городам, но именно такой эффект мог иметь место.

Цель поощряла службы скорой помощи лгать о времени выполнения вызовов, переклассифицировать срочные случаи, пересадить бригаду скорой помощи на несанитарные транспортные средства, вывести персонал из сельских районов, жертвовать здоровьем и моральным духом медсотрудников.

Для одной разумной задачи это тот еще результат.

Как решить проблему «упорядоченной цели»? Один из возможных подходов заключается в том, чтобы сделать цели более сложными, покрывающими больше показателей с большим вниманием к деталям. Поучительным примером этого подхода может послужить метод развития финансовых регламентов за последние 30 лет.

Первым международным соглашением о регулировании банков для предотвращения финансовых кризисов стало Базельское соглашение 1988 года, которое часто называют Базель I[227]. Оно установило стандарты для каждого из банков, работающих на международном уровне, определив минимальный уровень капитала каждого банка. Капитал — это то, что стоит между банком и банкротством: банк с большим капиталом может понести огромные потери, прежде чем станет неплатежеспособным, в то время как банк, который финансирует свою деятельность с помощью заемных средств, а не собственных, гораздо более уязвим{36}. Иными словами, Базельское соглашение стало международным соглашением о том, чтобы банки не занимали слишком много или не достигали слишком высокого коэффициента левериджа{37}.

Пока соглашение Базель I было отмечено как первый шаг в сторону финансовой стабильности, оно представляло собой грубое правило, так как не уделяло должного внимания тому факту, что разные банки берут на себя разные риски. Например, банк, который выдал кредит стартапу из Кремниевой долины на сумму $100 миллионов, берет на себя гораздо больше риска, чем банк, который выделил кредит на ту же сумму американскому правительству. Кажется, опрометчиво устанавливать правила по капиталу, которые разработаны, чтобы быть гарантией от рисков, но которые сами же их игнорируют.

Базель I выделял пять различных категорий риска, и требования к капиталу варьировались в зависимости от того, какой объем операций банк проводил в каждой из этих областей. Но регуляторы вскоре пришли к выводу, что пяти категорий риска недостаточно: их правила были слишком упрощенными и имели слишком много недоработок. В то время как банки использовали передовые компьютеризированные модели риска на основе океана цифровых данных, требования к капиталу по Базелю I были настолько простыми, что их можно было рассчитать с помощью ручки и листка бумаги. Банки пытались выступить против ограничений регулятора, максимизируя свой коэффициент левериджа и находясь в поиске места для маневров в рамках правил{38}.

С учетом несоответствия сложности между банковскими моделями риска и простыми базельскими правилами это место для маневра было легко найти. Банки тщательно искали инвестиции, которые согласно правилам считались безопасными, но, по мнению банков, были перспективными, рискованными и, следовательно, потенциально высокоприбыльными.

Поэтому в 2004 году была опубликована серия регуляторных обновлений, которые подразумевали гораздо более сложное понятие риска. В то время как Базель I был изложен на 30 страницах, Базель II составлял 347 страниц и был увязан с моделями рисков самих банков — буквально с миллионами различных рисковых параметров на основе данных и с учетом рынка.

Недоработки были подчищены, но в ретроспективе Базель II не был успешным документом. За самым сложным соглашением по финансовой стабильности, составленным человеком, незамедлительно последовал самый сложный финансовый кризис в истории. Почему? Было бы абсурдно выделить единственную причину, но очевидно, что ныне хорошо известные проблемы, которые неблагоприятно повлияли на цели системы здравоохранения, также разрушили и Базель II.

Так как Базель II строился вокруг концепции оценки рисков, банки могли повышать коэффициент левериджа, если были способны найти активы с очень низким коэффициентом риска. Самый низкий возможный коэффициент риска равнялся нулю: если банк мог найти инвестиции с таким коэффициентом риска и неплохой прибылью, Базель II поощрял банк брать взаймы значительные суммы, чтобы направить их в эти инвестиции. Но какие активы имеют на бумаге нулевой риск и при этом дают жирную прибыль инвесторам? Ответ — греческие государственные облигации. Базельские правила были установлены богатыми правительствами, и поэтому — вполне естественно — они трансформировали их под себя. Банки Европейского союза имели право кредитовать правительства стран Европейского союза с нулевым коэффициентом риска[228].

Поэтому банки могли одалживать и кредитовать деньги Греции, которая была безрисковой на бумаге, но (что любопытно) приносила приличную прибыль. Пока правила утверждали, что Греция не несла в себе рисков, высокий доход по долгу Греции показывал, что рынок думал иначе. Это был типичный пример извращенных базельских правил: они награждали банки за совершение инвестиции с низким риском на бумаге, но высокой рыночной доходностью, что подразумевало в действительности высокий риск. Базельские правила поощряли банки искать все места, где правила казались неверными, — и вливать как можно больше денег в эти слепые зоны.

Спрос на якобы безопасные активы служил стимулом к разработке сложных финансовых инструментов, создающих теоретически безопасные инвестиции на фоне высокорискованного субстандартного ипотечного кредитования. Подобные инвестиции имели признаки непредсказуемости — возможно, случайно, а возможно, преднамеренно, они ограничивали риски в наихудших случаях, что означало, что активы обычно были безопасны и имели репутацию очень стабильных, но также и скромные шансы катастрофического взрыва.

Последнее печальное последствие Базеля заключалось в том, что антистимулы были одинаковыми для всех. Вместо естественной конкуренции, инвестирования в реальные проекты по всему миру банки стремились протиснуться сквозь те же лазейки — кредитовать Грецию, покупать субстандартные деривативы — и таким образом оказывались в бедственном положении в одно и то же время по одной и той же причине.

Решили ли проблему последующие законы? Возможно: посткризисное соглашение Базель III консервативнее, чем Базель II. Но оно также стало более сложным. Базель III в два раза длиннее предыдущего соглашения, а внутреннее законодательство (например, закон Додда-Франка в США) даже еще длиннее — десятки тысяч страниц. Урок Базеля II, кажется, заключается в том, что усложнение целей не остановит их обход — оно лишь приведет к тому, что правила будут обходить более сложным и неожиданным образом.

Спустя несколько лет после начала кризиса одна из наиболее творческих фигур центральных банков задалась смелым вопросом. Это был Энди Халдан, главный экономист Банка Англии. Его вопрос звучал так: что, если эти более детализированные попытки количественного определения рисков были бесполезными — или даже хуже?[229]

Халдан изучил все, что было известно о банках, которые стали банкротами в течение кризиса, и то, насколько безопасно они выглядели до кризиса в соответствии с различными сложными критериями Базеля II и Базеля III. Он сравнил эти цифры с самым простым возможным показателем риска: брал ли банк большие суммы в долг?

На ежегодном собрании представителей центральных банков в Джексон-Холе (Вайоминг) Халдан представил свои выводы: каждый раз, когда вы разбивали данные, высокорациональные, гиперколичественные методы риск-менеджмента становились менее эффективными, чем простое железное правило: «Остерегайтесь банков с задолженностью». Возможно, Базель I не был настолько простым, разделив леверидж на всего лишь пять категорий. Возможно, напротив, мы переусердствовали, разделив его вообще.

Железное правило вроде этого доказало свою удивительную эффективность в различных условиях: психолог Герд Гигеренцер собрал огромную библиотеку простых эвристик, конкурирующих или даже превосходящих сложные правила решений, которые многие считают теоретически оптимальными. Уже есть три примера: лавины, сердечные приступы и инвестиционные портфели.

Лавины сложно спрогнозировать: они возникают из едва различимых и сложных взаимодействий между выпавшим снегом, температурой, уклоном и другими факторами. Лавины, приводящие к наибольшим повреждениям, случаются редко, и из-за этого их непросто предвидеть, что создает риск для горнолыжников в дикой местности. Однако, как выяснилось, существует решение. Простой метод носит название чек-листа очевидных подсказок, легко запоминается лыжниками и является удивительно хорошей гарантией защиты. Например, сообщалось ли о лавинах в области за последние 48 часов? Видны ли признаки таяния на поверхности снега? Выпадал ли снег или шел ли дождь за последние 48 часов? Если некоторые из очевидных подсказок имеют место, лыжники должны избегать таких склонов. Когда исследователи изучили базу данных по 751 случаю схода лавин в США, они пришли к выводу, что в большинстве случаев действовали факторы риска и метод «очевидных подсказок» предотвратил трагедию[230].

Параллель с банковским кризисом кажется очевидной. Анализ Энди Халдана обнаружил единственную «очевидную подсказку», дающую понять, что банк уязвим, — то, в какой степени он полагался на заемные средства, а не на свой капитал.

Если простые правила могут предсказать лавины, то, возможно, они также смогу предсказать сердечные приступы? Рассмотрим решение, которое должен принять врач, когда пациент обращается в отделение неотложной помощи с серьезной болью в грудной клетке. Если пациент находится на ранних стадиях сердечного приступа, его нужно немедленно направлять в профильное отделение для больных с коронарной недостаточностью. Но это дорого, есть риск осложнений, так как больницы являются благодатной почвой для заболеваний, устойчивых к лекарствам, и также неудобно для любого пациента, который в действительности нуждается лишь в таблетке от расстройства желудка и отдыхе. Существует множество других тестов, которые можно провести, множество других способов, которые позволят поставить диагноз[231].

Исследователи из Мичиганского университета во главе с Ли Грином изучили процесс принятия решений врачами в подобных ситуациях. Они обнаружили, что доктора склонны действовать с наименьшим риском — до такой степени, что они с равной вероятностью направляли пациентов без сердечного приступа и пациентов с сердечным приступом. Они также могли и рискнуть.

Ответом исследователей стало составление сложного диагностического руководства: таблицы вероятностей, дополненной удобным карманным калькулятором. Руководство требовало от докторов выполнить некоторые тесты, использовать таблицу, вводить цифры в калькулятор и затем определить вероятность того, что пациент нуждается в срочной коронарной помощи. Это руководство было успешным: оно позволило врачам серьезно сократить количество ошибочных направлений, лишь немного увеличив число пострадавших от сердечного приступа, которые были направлены неверно. Конечно, это болезненный компромисс, но в медицине их полно. Более серьезная проблема заключалась в том, что руководство было слишком сложным, чтобы заинтересовать врачей.

Поэтому Ли Грин с коллегами разработали простое дерево решений, избавившись от многих деталей в диагностической таблице и сфокусировавшись на более очевидных подсказках. Дерево решений содержало три вопроса с ответами «да/нет». Первый вопрос: показывает ли кардиомонитор конкретные аномалии пациента? Если да — бегом в отделение коронарной помощи. В противном случае вопрос второй: основная жалоба пациента связана с болью в груди? Если нет, необходимости в коронарной помощи нет. В случае положительного ответа третий вопрос укажет врачу на необходимость искать одну из пяти очевидных подсказок — любой из них достаточно для того, чтобы отправить пациента в профильное коронарное подразделение.

Дерево решений можно записать на небольшой карточке. В отличие от сложного алгоритма, оно не требует использования калькулятора. Но оно работает. Фактически кажется, что оно работает лучше, чем врачи или сложное диагностическое оборудование, отправляя практически каждого пациента с сердечным приступом за профильной помощью (даже в большей степени, чем врачи, настроенные подстраховаться), но выдавая меньше ложных результатов, чем диагностическое оборудование. Что еще более важно, данный метод экономит время и силы в срочной ситуации: это значит, что, в отличие от сложного диагностического аппарата, к нему можно привыкнуть{39}.

Схожим образом можно описать абсолютно другую проблему выбора оптимального набора инвестиций — к примеру, когда мы откладываем деньги на пенсию. В 1952 году молодой профессор финансов Гарри Марковиц работал над сложным методом выбора оптимального финансового портфеля, а также минимизации любого ожидаемого возврата или максимизации ожидаемого возврата при любом заданном риске. Базовая идея проста: если вы покупаете акции в компании, производящей зонтики, и у производителя солнечных очков, ваши дела будут идти хорошо при любой погоде. Детали, конечно, более продуманны — настолько, что позволили Марковицу получить Нобелевскую премию по экономике.

Хотя о последнем есть забавная история: вскоре после публикации своей теории он начал работу над пенсионным сберегательным планом и должен был выбрать оптимальный набор инвестиций для собственного выхода на пенсию. Это было идеальной возможностью воплотить блестящую теорию на практике. Но он отверг эту возможность и вложил половину своих денег в акции, а половину — в облигации. Эту историю часто называют идеальной иллюстрацией идеи о том, что экономическую теорию до конца сложно понять даже тем, кто ее создал.

И все же тут есть ирония внутри иронии.

Марковиц-инвестор был все время прав. Ошибался Марковиц-теоретик с Нобелевской премией по экономике. Причина была в том, что теория Марковица идеальна в том случае, когда предоставляет бесконечные объемы данных, но она может не оправдать ожиданий в ситуации с более ограниченной информацией.

Рассмотрим, например, акции двух нефтяных компаний. Теория Марковица предполагает, что мы понимаем, каким образом курс этих акций имеет тенденцию изменяться по отношению друг к другу, — тогда она предложит эффективный набор акций обеих компаний. Но как именно работает эта зависимость? Оглядываясь назад, мы видим периоды, когда курсы движутся синхронно: цены на нефть растут — курс акций растет; цены на нефть падают — и курс акций с ними. Но есть ситуации, например с разливом нефти, как при катастрофе на «Глубоководном горизонте» в 2010 году, когда акции причастной компании упадут, а конкуренты будут в порядке. Хотя история и является своего рода руководством, но она не идеальна — особенно если оценивать вероятность уникальных событий (по определению в архивах вы найдете немного упоминаний о них — возможно, вообще ни одного).

Недавнее исследование показывает, что при наличии ограниченных данных железное правило Марковица — разделить активы в равном количестве между такими категориями, как акции, облигации и собственность, — превосходит Нобелевскую теорию Марковица. Что мы подразумеваем под «ограниченными данными»? Все, что включается в отрезок меньше 500 лет, вероятно, ограниченно настолько, чтобы решить исход дела в пользу железного правила[232].

Вновь мы видим параллель с предписаниями Базеля II. Как и нобелевская теория Марковица, они требовали множество данных, чтобы быть устойчивыми. Эти данные отсутствовали. Модели рисков, которые использовали банки в начале 2000-х, — те, которые Базель II поощрял к использованию, — могли ссылаться только на информацию пятилетней давности, которая при этом включала сотни тысяч параметров. Невероятно сложные статистические структуры были построены на самом зыбком фундаменте.

Такая проблема известна как чрезмерно близкая подгонка — она возникает, когда детализированный статистический анализ слепо повторяет исторические данные. Представьте диаграмму разброса с прямой или сглаженной кривой, проходящей сквозь облако точек, чтобы выявить эту тенденцию. Прямая с чрезмерно близкой подгонкой выглядит, скорее, как головоломка типа «соедини точки», где определяется закономерность сердечных приступов или лавин, которой на самом деле нет. Когда поступают новые данные — новые точки, они с меньшей вероятностью возникнут рядом с изгибающейся кривой. Сложные правила похожи на прямую с чрезмерно близкой подгонкой: разработаны задним числом, но с низкой способностью прогнозирования. Более простое правило — нарисованная прямая или сглаженная кривая — тоже не подходит для прежним данных, но зачастую работает лучше, когда поступают новые.

Создание более сложных целей не может быть решением. Сложный показатель с такой же вероятностью будет обманут, и простое железное правило зачастую представляет точное руководство к пониманию происходящего.

В таком случае проблема возвращается к обману. Лавины и сердечные приступы не могут обмануть систему, которая распознает их, — они могут быть опасны, но они не врут. Но что произойдет, если регуляторы Базеля просто сделают вывод из анализа Энди Халдана, что они должны порвать сотни страниц правил и заменить их на одно — об ограничении суммы, которую банк может брать взаймы по отношению к капиталу? Мы бы вернулись к записи на прием Тони Блэра. Так или иначе банки найдут способ обойти простое правило левериджа.

Так же как вопрос «Сколько банк взял взаймы?» является хорошим железным правилом, когда банки не пытаются добиться этой цели, вопрос «Сколько пациентов попадут на прием в течение 48 часов?», вероятно, является хорошим правилом по общей оценке качества хирургов, которые не знают, что проходят проверку. «Сколько бригад скорой помощи прибудет в течение восьми минут?», вероятно, представляет собой отличную лакмусовую бумажку для оценки качества услуг скорой помощи, но при условии, что у последних нет целей с такой формулировкой.

К счастью, существует старое решение проблемы — и оно знакомо каждому студенту.

Задумайтесь о том, как работает система экзаменов. Вы учитесь месяцами или годами, зная, что лишь маленькая доля знаний, собранных вами, понадобится на финальном экзамене. Как говорил философ Джереми Бентам в 1830 году, когда размышлял над экзаменами гражданской службы, неопределенность экзаменационного билета подразумевает «невозможность знания» того, как обмануть систему экзаменов. Единственный ответ узнать это «невозможное» знание — усердно работать и пытаться преуспеть во всем[233].

Ответ представляет собой не увесистую книгу правил Базеля и не одно простое железное правило. Мы должны определить множество железных правил и преднамеренно оставить некую неопределенность того, какое из них будет применено в каждой конкретной ситуации. К примеру, в случае со службой скорой помощи вы можете использовать «процент звонков, принятых за восемь минут» как показатель для проверки и добавить несколько дополнительных: процент звонков, принятых за 12 минут, или за 20 минут, или 6 минут 37 секунд; соотношение пациентов, которые умерли из-за того, что их случаи не были определены как смертельно опасные; последовательность предоставления услуг в городских и сельских районах и т. д. Вы можете определить сотни железных правил вроде этих. Будет невозможно обмануть их все, так как обман одного ухудшит результаты по второму. Но служба скорой помощи, которая обычно работает эффективно, должна выдавать хорошие показатели по многим из них.

Было бы глупо пытаться проверить каждое из этих железных правил, так как проверки регулятора стали бы невозможной бюрократией и абсурдно поверхностными. Существует другой риск: если бы служба скорой помощи знала, как для получения общей оценки взвешиваются все цели, она бы нашла способ обмануть и это. Вместо этого для каждой проверки регулятор выбирал несколько выборочных показателей и глубоко изучал их.

Банки уже подвергаются суровой проверке под названием стресс-тест. Стресс-тесты — это сценарии катастрофы, в которых банк просчитывает, что случится в определенных неблагоприятных ситуациях: к примеру, при резком увеличении процентных ставок, или внезапной валютной девальвации, или обвале рынка жилья. Тем не менее эти тесты слишком предсказуемы, как и экзаменационный лист с вопросами, оглашенными заранее. Регуляторы в США начали замечать, что банки делали конкретные узкие ставки (например, что долг, связанный с ипотекой, будет иметь плохие последствия), которые выглядели неприбыльными, но давали прекрасную отдачу в конкретных сценариях стресс-теста[234].

Применение решения Джереми Бентама — решения, одобренного экзаменаторами по всему миру, — попросту означает, что стресс-тест должен стать непредсказуемым. Энди Халдан, главный экономист Банка Англии, думает, что это вполне возможно.

«Вы появитесь в финансовой фирме из ниоткуда, другими словами, не по ежегодному графику, и скажете: “Не могли бы вы показать ваши стресс-тесты по…” — Хендан делает паузу в поисках примера, — “вашему портфелю леверидж-кредитов{40}?”»[235]

Вместо того чтобы предоставить банку месяцы на подготовку ответа, регулятор настаивает на ответе в течение нескольких часов. Если банк быстро предлагает хороший ответ, то: «Отлично, увидимся через шесть месяцев, когда настанет время для вашей следующей проверки. Кстати, это может быть и не шесть месяцев. Это может быть завтра, а может быть и через год».

И если время теста умышленно растягивается, банк ждет наказание. «Если они дадут плохой ответ, их ждет черная метка. Не уверен, что означает черная метка, но, знаете, почему бы не установить так: три метки, и вы выходите из игры? Возможно, это нормально — не знать ваши текущие леверидж-кредиты, но если вы не знаете ваш планируемый на будущее рыночный портфель или объемы кредитов суверенному государству, действительно ли вы должны находиться в кресле управляющего банком?»

Энди Халдан — не единственный, кто выступает за случайность в целях. Старший представитель органа регулирования, стоящий под Тони Блэром, Гвин Беван приводит схожие доводы в пользу неопределенных или неожиданных целей в NHS Великобритании[236]. Так же считает и Дэвид Шпигельхалтер, один из лидирующих медицинских статистиков Великобритании, и Эндрю Дилнот, глава Национальной статистической службы Великобритании.

Регуляторы американских банков сделали пробный шаг в отношении неопределенности, запрашивая информацию у банков и не сообщая им, как эта информация будет оцениваться. Это хорошо. Но в целом финансовые регуляторы не спешат двигаться в сторону идеи случайности и неопределенности в своих правилах. Как говорит Халдан, «я считаю, что мы удаляемся от этого».

Так почему бы регуляторам не перенять конструктивную неопределенность тестов, проводимых в случайные моменты времени, в произвольно выбранных регионах, которые с большей вероятностью окажутся более эффективными, чем опрятные, предсказуемые чек-листы?

Одно из возможных опасений связано с тем, что неопределенное регулирование предоставит слишком большую дискреционную власть регулятору. Но это необязательно верно. В конце концов, экзаменационная система имеет гарантии защиты: программу со списком тем, которые будут рассмотрены, последовательную историю предыдущих экзаменационных листов для установления контекста, независимых внешних экзаменаторов, которые проводят проверку в реальных условиях, апелляционный процесс. Схожая система может работать в таких регулируемых областях, как здравоохранение и финансы. Если регуляторы четко устанавливают свои приоритеты, излагают виды вопросов, которые могут быть заданы, и должны доказывать свои действия в случае апелляции, тогда возможности для злоупотреблений — как у регулятора, так и компаний, которые он регулирует, — значительно снижаются.

Более циничное объяснение состоит в том, что сами регуляторы зачастую имеют конфликты интересов, что дает им антистимулы создавать систему, которую можно обмануть. Государственные учреждения, которые отвечают за проверку школ или больниц, также склонны отвечать за обеспечение того, что их дела идут хорошо. Финансовые регуляторы должны не только выяснить уровень безопасности банков, но и удерживать банковскую систему в безопасности. Когда Тони Блэр ввел цель по времени ожидания для врачей общей практики, он надеялся создать статистику, которая впечатлит избирателей. Разумеется, подобные регуляторы будут заинтересованы в подходах, которые могут создавать серию упорядоченных данных, отражающих улучшение с наименьшим объемом усилий и риска. Решение в том, чтобы как можно быстрее отделить роль проверки системы от роли по улучшению системы.

Возможно, самая простая причина — это наш общий страх беспорядочной неопределенности. Нас, людей, привлекает опрятность регулятора и регулируемого органа, точно знающих, какие его ждут процедуры и в каких местах нужно поставить галочки.

«Это достаточно беспорядочный подход к инспектированию, — признает Энди Халдан в отношении своего альтернативного видения. — Но его можно провести с административным ограниченным бюджетом. Вам не нужна огромная армия. Вам нужна лишь небольшая оперативная группа».

Мобильность и неожиданность оперативной группы — именно то, в чем отчаянно нуждаются многие регуляторы.

В сентябре 2015 года Volkswagen, один из крупнейших автопроизводителей в мире, был пойман на обмане в отношении американских тестов состава выхлопных газов. Общественность была потрясена. Акции немецкого автогиганта упали, директор Мартин Винтеркорн уволился[237]. Немцы беспокоились, что репутация любого национального производителя может быть запятнана ассоциацией с Volkswagen.

Как мог произойти подобный обман? Производители должны следовать программе лабораторных тестов, созданных с целью убедиться, что двигатели выделяют низкий объем оксидов азота, газов, которые могут вызывать разнообразные проблемы загрязнения — кислотные дожди, смог и копоть, негативно воздействовать на сельский урожай и вызывать проблемы с органами дыхания у пожилых людей и детей, порой с летальным исходом. Тесты сложны, а стандарты высоки. Но тесты также абсурдно предсказуемы — серия предопределенных маневров на беговой дорожке.

В результате Volkswagen мог совершить обман. Автомобили компании, снабженные компьютерами и датчиками, как и все современные модели, распознают особенности лабораторного теста. Они переключались на специальный режим тестирования, при котором уловитель оксида азота фильтровал атмосферные загрязнения, но ценой замедленного режима двигателя, потребляющего много топлива. За пределами лаборатории двигатель был быстрее и эффективнее, но выпускал гораздо больше оксида азота — возможно, в 20-30 больше.

То, что сделал Volkswagen, удивительным образом похоже на то, что наблюдали регуляторы в банковской сфере с банками, покупающими неприбыльные активы с целью хорошо проявить себя на стресс-тестах Федеральной резервной системы. Банки включали «специальный режим», чтобы хорошо показать себя на этих тестах, так же как и Volkswagen включал специальный режим, который приукрашивал данные по выбросам веществ. Разница в том, что нелегальное в автомобилестроении, по-видимому, легально в экономике.

Но настоящий скандал заключается не в том, что Volkswagen обнаружил способ обмануть предсказуемый тест. Он связан с тем, что регуляторы сохраняют свои тесты такими предсказуемыми, хотя они прекрасно осведомлены о проблеме. В 1998 году Агентство по охране окружающей среды США обнаружило доказательство, что производители грузовиков использовали специальные режимы, чтобы обмануть тесты по выбросу веществ. Агентство успешно предприняло действия против семи из них, включая Volvo, Renault, Caterpillar и Mack — производителей, которые суммарно производили практически каждый дизельный двигатель грузовых автомобилей. Кажется, с тех пор мало что изменилось (самодовольные европейцы, возможно, захотят отметить, что меры регулирования Европейского союза считаются даже более простыми для обмана).

Volkswagen не был пойман, так как Агентство ввело более предсказуемые правила. Обман обнаружился, когда Международный совет по экологически чистому транспорту (ICCT), некоммерческая группа, изучил данные по выбросам автомобилей Volkswagen. Совет не был предубежденным обвинителем: он с полной уверенностью ожидал увидеть чистую машину. Но все же совершил что-то простое и неожиданное: он установил мониторы по выбросам в некоторые автомобили Volkswagen и проехал на них из Сан-Диего до Сиэтла. Этого было достаточно, чтобы выявить обман.

Самый сложный экзамен в мире не так сложен, если все пользуются шпаргалками. Простой вопрос в неожиданном направлении может выявить куда больше.

Автоматизация

«Да что же происходит?»

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: