Пример подбора моделей нелинейной связи, сводящихся к линейной модели

Суть политики Кеннеди-Джонсона (Джон Кеннеди — президент США с 1961 по 1963 г., Линдон Джонсон — президент США с 1963 по 1969 г.) состояла в сокращении налогов, увеличении расходов на оборону и ускорении роста количества денег в обращении. Предполагалось, что это вызовет оживление экономики США и будет способствовать снижению нормы безработицы (т. е. доли безработных в общей численности рабочей силы). Ожидалось также, что возрастание темпов инфляции будет при этом не очень сильным.

Рассмотрим прежде всего диаграмму рассеяния для переменных UNJOB (процент безработных в общей численности рабочей силы) и INF (темп инфляции):

Облако рассеяния довольно округло, и это согласуется с весьма низким значением коэффициента детерминации , получаемым при подборе модели линейной зависимости от .

Форма облака рассеяния не указывает и на какой-либо другой тип зависимости между этими двумя переменными на периоде наблюдений с 1958 по 1984 год.

В то же время, в период с 1961 по 1969 год наблюдалась следующая картина.

Год	1961	1962	1963	1964	1965	1966	1967	1968	1969
INF	1.0	1.1	1.2	1.3	1.7	2.9	2.9	4.2	5.4
UNJOB	6.5	5.4	5.5	5.0	4.4	3.7	3.7	3.5	3.4

Характер диаграммы рассеяния явно указывает на наличие нелинейной связи между рассматриваемыми переменными в период с 1961 по 1969 год (кривая Филлипса). Изображенная на диаграмме прямая, подобранная методом наименьших квадратов, очевидным образом не соответствует характеру статистических данных, хотя значение коэффициента детерминации и представляется достаточно высоким. (Позднее мы сможем более квалифицированно говорить о том, действительно ли получаемое при подборе модели значение коэффициента детерминации достаточно велико.) В связи с этим, при подборе моделей к реальным статистическим данным следует обращать вниманиене только на коэффициент детерминации, но и (обязательно!) на соответствие подобранной модели характеру статистических данных. Далее мы специально обсудим эту проблему, известную как проблема адекватности полученной модели имеющимся статистическм данным.

Поскольку, на первый взгляд, расположение точек напоминает график обратной пропорциональной зависимости, можно попробовать рассмотреть модель наблюдений

соответствующую линейной связи между переменными и . Подбор такой связи приводит к модели

с достаточно высоким коэффициентом детерминации . Однако, характер диаграммы рассеяния переменных и

указывает на неадекватность и этой модели.

Обратившись еще раз к диаграмме рассеяния исходных переменных и (для данных за 1961—1969 годы), можно заметить, что кривая зависимости от по-видимому имеет вертикальнуюасимптоту . Учесть последнее обстоятельство можно в рамках модели Michaelis-Menton

которую можно преобразовать к виду

учитывающему наличие и вертикальной и горизонтальной асимптот. Такая модель связи линеаризуется переходом к обратным величинам , . Действительно, тогда

где

Диаграмма рассеяния для обратных величин , имеет вид

Теперь уже точки на диаграмме рассеяния весьма хорошо следуют прямой линии, подобранной методом наименьших квадратов:

. Здесь , так что , , и оцененная модель Michaelis-Menton имеет вид

Модель Michaelis-Menton хороша тем, что учитывает наличие асимптот и линеаризуется. С другой, стороны, она является лишь частным случаем более общей модели связи

с тремя свободно изменяющимися параметрами. Действительно, в модели Michaelis-Menton

и она только двухпараметрическая, так что модель с тремя свободными параметрами является более гибкой. Но, вместе с тем, трехпараметрическая модель уже не линеаризуется, и параметры приходится оценивать, используя итерационную процедуру последовательного уменьшения суммы квадратов

(Конечно, в предположении аддитивности ошибок .) «Стартовые» значения параметров в этой процедуре можно взять близкими к оценкам , полученным при оценивании предыдущей модели, например, , а стартовое значение можно положить равным .

Реализация итерационной процедуры приводит к следующим оценкам параметров:

при этом, . Оцененная модель имеет вид

На следующей диаграмме показаны наблюдаемые значения переменной INF (INFtrue)и значения (INFmodel), получаемые по оцененной модели.

Подобранная модель показывает, что экспансионистские экономические мероприятия первоначально обеспечивают снижение нормы безработицы и реальный экономический рост при умеренной инфляции. Однако, удержать норму безработицы ниже ее естественного значения в течение продолжительного времени можно лишь за счет постоянно ускоряющегося темпа инфляции. К окончанию срока пребывания у власти Линдона Джонсона темп инфляции начал стремительно возрастать, что потребовало смены экономической политики.

Соответственно, наблюдать кривые Филлипса в указанном виде удается только на краткосрочных интервалах.

1.12. ЛИНЕЙНЫЕ МОДЕЛИ С НЕСКОЛЬКИМИ
ОБЪЯСНЯЮЩИМИ ПЕРЕМЕННЫМИ

Рассмотрим статистические данные о потреблении текстиля (текстильных изделий) в Голландии в период между двумя мировыми войнами с 1923 по 1939 годы. В приведенной ниже таблице T — реальное потребление текстиля на душу населения, DPI — реальный располагаемый доход на душу населения, P — относительная цена текстиля. Все показатели выражены в индексной форме, в процентах к 1925 году.

Год	T	DPI	p	Год	T	DPI	p
1923	99.2	96.7	101.0	1932	153.6	105.3	65.4
1924	99.0	98.1	100.1	1933	158.5	101.7	61.3
1925	100.0	100.0	100.0	1934	140.6	95.4	62.5
1926	111.6	104.9	90.6	1935	136.2	96.4	63.6
1927	122.2	104.9	86.5	1936	168.0	97.6	52.6
1928	117.6	109.5	89.7	1937	154.3	102.4	59.7
1929	121.1	110.8	90.6	1938	149.0	101.6	59.5
1930	136.0	112.3	82.8	1939	165.5	103.8	61.3
1931	154.2	109.3	70.1

Для объяснения изменчивости потребления текстиля в указанном периоде мы можем привлечь в качестве объясняющей переменной как располагаемый доход DPI, так и относительную цену на текстильные изделия P. Если исходить из предположения о постоянстве эластичностей потребления текстиля по доходу и цене, то тогда следует подбирать линейные модели для логарифмов индексов, а не для самих индексов. Подбор таких моделей методом наименьших квадратов приводит к следующим результатам (использовались десятичные логарифмы):

Вторая модель, несомненно, лучше описывает наблюдаемую динамику потребления текстиля. Однако, естественно возникает вопрос о том, нельзя ли для объяснения изменчивости переменной Т использовать одновременно и располагаемый доход и относительную цену текстиля, улучшит ли это объяснение изменчивости потребления текстиля.

Чтобы привлечь для объяснения изменчивости потребления текстиля обе переменные DPI и T, мы рассматриваем модель линейной связи логарифмов этих величин

и соответствующую ей модель наблюдений

Оценки параметров можно опять находить методом наименьших квадратов, путем минимизации по всем возможным значениям суммы квадратов

Минимум этой суммы достигается на некотором наборе так что

Это минимальное значение мы опять обозначаем

и называем остаточной суммой квадратов.

Коэффициент детерминации определяется, как и в модели связи между двумя переменными:

Здесь

где

При этом,

где

так что

(и опять, разложение справедливо только при включении постоянной составляющей в правую часть соотношения, определяющего линейную модель связи). При этом также

т. е. коффициент детерминации равен квадрату (обычного) выборочного коэффициента корреляции между переменными и

Разности

называются остатками.

По поводу получения явных выражений для оценок наименьших квадратов мы поговорим несколько позднее, а сейчас просто приведем результаты оценивания для нашего примера:

Мы видим, что в результате привлечения для объяснения изменчивости потребления текстиля сразу двух показателей и произошло заметное увеличение коэффициента детерминации по сравнению с лучшей из двух моделей, использовавших только один показатель — от значения до значения .

Коэффициент в подобранной модели связи интерпретируется здесь как эластичность потребления текстиля по доходу при неизменном значении относительной цены на текстиль, а коэффициент — как эластичность потребления текстиля по относительным ценам при неизменном уровне дохода. Такие значения коэффициентов говорят в пользу того, что потребление текстиля эластично по доходам и неэластично по ценам. Вопрос о том, в какой степени можно доверять подобным заключениям, мы рассмотрим далее в контексте вероятностных моделей.