Пример подбора моделей нелинейной связи, сводящихся к линейной модели

Суть политики Кеннеди-Джонсона (Джон Кеннеди — президент США с 1961 по 1963 г., Линдон Джонсон — президент США с 1963 по 1969 г.) состояла в сокращении налогов, увеличении расходов на оборону и ускорении роста количества денег в обращении. Предполагалось, что это вызовет оживление экономики США и будет способствовать снижению нормы безработицы (т. е. доли безработных в общей численности рабочей силы). Ожидалось также, что возрастание темпов инфляции будет при этом не очень сильным.

Рассмотрим прежде всего диаграмму рассеяния для переменных UNJOB (процент безработных в общей численности рабочей силы) и INF (темп инфляции):

Облако рассеяния довольно округло, и это согласуется с весьма низким значением коэффициента детерминации , получаемым при подборе модели линейной зависимости   от .

Форма облака рассеяния не указывает и на какой-либо другой тип зависимости между этими двумя переменными на периоде наблюдений с 1958 по 1984 год.

В то же время, в период с 1961 по 1969 год наблюдалась следующая картина.

 

Год 1961 1962 1963 1964 1965 1966 1967 1968 1969
INF 1.0 1.1 1.2 1.3 1.7 2.9 2.9 4.2 5.4
UNJOB 6.5 5.4 5.5 5.0 4.4 3.7 3.7 3.5 3.4

Характер диаграммы рассеяния явно указывает на наличие нелинейной связи между рассматриваемыми переменными в период с 1961 по 1969 год (кривая Филлипса). Изображенная на диаграмме прямая, подобранная методом наименьших квадратов, очевидным образом не соответствует характеру статистических данных, хотя значение коэффициента детерминации  и представляется достаточно высоким. (Позднее мы сможем более квалифицированно говорить о том, действительно ли получаемое при подборе модели значение коэффициента детерминации достаточно велико.) В связи с этим, при подборе моделей к реальным статистическим данным следует обращать вниманиене только на коэффициент детерминации, но и (обязательно!) на соответствие подобранной модели характеру статистических данных. Далее мы специально обсудим эту проблему, известную как проблема адекватности полученной модели имеющимся статистическм данным.

Поскольку, на первый взгляд, расположение точек напоминает график обратной пропорциональной зависимости, можно попробовать рассмотреть модель наблюдений

соответствующую линейной связи между переменными   и . Подбор такой связи приводит к модели

с достаточно высоким коэффициентом детерминации . Однако, характер диаграммы рассеяния переменных  и

указывает на неадекватность и этой модели.

Обратившись еще раз к диаграмме рассеяния исходных переменных  и   (для данных за 1961—1969 годы), можно заметить, что кривая зависимости   от   по-видимому имеет вертикальнуюасимптоту . Учесть последнее обстоятельство можно в рамках модели Michaelis-Menton

которую можно преобразовать к виду

учитывающему наличие и вертикальной и горизонтальной асимптот. Такая модель связи линеаризуется переходом к обратным величинам , . Действительно, тогда

где

Диаграмма рассеяния для обратных величин ,  имеет вид

Теперь уже точки на диаграмме рассеяния весьма хорошо следуют прямой линии, подобранной методом наименьших квадратов:

. Здесь , так что , , и оцененная модель Michaelis-Menton имеет вид

Модель Michaelis-Menton хороша тем, что учитывает наличие асимптот и линеаризуется. С другой, стороны, она является лишь частным случаем более общей модели связи

с тремя свободно изменяющимися параметрами. Действительно, в модели Michaelis-Menton

и она только двухпараметрическая, так что модель с тремя свободными параметрами является более гибкой. Но, вместе с тем, трехпараметрическая модель уже не линеаризуется, и параметры  приходится оценивать, используя итерационную процедуру последовательного уменьшения суммы квадратов

(Конечно, в предположении аддитивности ошибок .) «Стартовые» значения параметров  в этой процедуре можно взять близкими к оценкам , полученным при оценивании предыдущей модели, например, , а стартовое значение  можно положить равным .

Реализация итерационной процедуры приводит к следующим оценкам параметров:

при этом, . Оцененная модель имеет вид

На следующей диаграмме показаны наблюдаемые значения переменной INF (INFtrue)и значения (INFmodel), получаемые по оцененной модели.

Подобранная модель показывает, что экспансионистские экономические мероприятия первоначально обеспечивают снижение нормы безработицы и реальный экономический рост при умеренной инфляции. Однако, удержать норму безработицы ниже ее естественного значения в течение продолжительного времени можно лишь за счет постоянно ускоряющегося темпа инфляции. К окончанию срока пребывания у власти Линдона Джонсона темп инфляции начал стремительно возрастать, что потребовало смены экономической политики.

Соответственно, наблюдать кривые Филлипса в указанном виде удается только на краткосрочных интервалах.

1.12. ЛИНЕЙНЫЕ МОДЕЛИ С НЕСКОЛЬКИМИ
ОБЪЯСНЯЮЩИМИ ПЕРЕМЕННЫМИ

Рассмотрим статистические данные о потреблении текстиля (текстильных изделий) в Голландии в период между двумя мировыми войнами с 1923 по 1939 годы. В приведенной ниже таблице T реальное потребление текстиля на душу населения, DPI реальный располагаемый доход на душу населения, P — относительная цена текстиля. Все показатели выражены в индексной форме, в процентах к 1925 году.

Год T DPI p   Год T DPI p
1923 99.2 96.7 101.0   1932 153.6 105.3 65.4
1924 99.0 98.1 100.1   1933 158.5 101.7 61.3
1925 100.0 100.0 100.0   1934 140.6 95.4 62.5
1926 111.6 104.9 90.6   1935 136.2 96.4 63.6
1927 122.2 104.9 86.5   1936 168.0 97.6 52.6
1928 117.6 109.5 89.7   1937 154.3 102.4 59.7
1929 121.1 110.8 90.6   1938 149.0 101.6 59.5
1930 136.0 112.3 82.8   1939 165.5 103.8 61.3
1931 154.2 109.3 70.1          

 

Для объяснения изменчивости потребления текстиля в указанном периоде мы можем привлечь в качестве объясняющей переменной как располагаемый доход DPI, так и относительную цену на текстильные изделия P. Если исходить из предположения о постоянстве эластичностей потребления текстиля по доходу и цене, то тогда следует подбирать линейные модели для логарифмов индексов, а не для самих индексов. Подбор таких моделей методом наименьших квадратов приводит к следующим результатам (использовались десятичные логарифмы):

Вторая модель, несомненно, лучше описывает наблюдаемую динамику потребления текстиля. Однако, естественно возникает вопрос о том, нельзя ли для объяснения изменчивости переменной Т использовать одновременно и располагаемый доход и относительную цену текстиля, улучшит ли это объяснение изменчивости потребления текстиля.

Чтобы привлечь для объяснения изменчивости потребления текстиля обе переменные DPI и T, мы рассматриваем модель линейной связи логарифмов этих величин

и соответствующую ей модель наблюдений

Оценки параметров   можно опять находить методом наименьших квадратов, путем минимизации по всем возможным значениям   суммы квадратов

Минимум этой суммы достигается на некотором наборе  так что

Это минимальное значение мы опять обозначаем

и называем остаточной суммой квадратов.

Коэффициент детерминации определяется, как и в модели связи между двумя переменными:

Здесь

где

При этом,

где

так что

(и опять, разложение   справедливо только при включении постоянной составляющей   в правую часть соотношения, определяющего линейную модель связи). При этом также

т. е. коффициент детерминации равен квадрату (обычного) выборочного коэффициента корреляции между переменными  и

Разности

называются остатками.

По поводу получения явных выражений для оценок наименьших квадратов мы поговорим несколько позднее, а сейчас просто приведем результаты оценивания для нашего примера:

Мы видим, что в результате привлечения для объяснения изменчивости потребления текстиля сразу двух показателей   и   произошло заметное увеличение коэффициента детерминации по сравнению с лучшей из двух моделей, использовавших только один показатель — от значения   до значения .

Коэффициент   в подобранной модели связи интерпретируется здесь как эластичность потребления текстиля по доходу при неизменном значении относительной цены   на текстиль, а коэффициент — как эластичность потребления текстиля по относительным ценам при неизменном уровне дохода. Такие значения коэффициентов говорят в пользу того, что потребление текстиля эластично по доходам и неэластично по ценам. Вопрос о том, в какой степени можно доверять подобным заключениям, мы рассмотрим далее в контексте вероятностных моделей.

 

 

ЧАСТЬ 2. СТАТИСТИЧЕСКИЕ ВЫВОДЫ ПРИ СТАНДАРТНЫХ ПРЕДПОЛОЖЕНИЯХ
О ВЕРОЯТНОСТНОЙ СТРУКТУРЕ ОШИБОК В ЛИНЕЙНОЙ МОДЕЛИ НАБЛЮДЕНИЙ




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: