Обратная» модель прямолинейной связи

Пусть наша задача состоит в оценивании модели прямолинейной связи между некоторыми переменными и на основенаблюдений n пар значений этих переменных. Мы уже рассмотрели вопрос об оценивании параметров такой связи, исходя из модели наблюдений . Что изменится, если мы будем исходить из «обратной» модели ?

Пусть — оценки параметров и в модели наблюдений , а — оценки параметров в модели наблюдений . Тогда

т. е.

или

В то же время, по первой модели наблюдений мы получаем наилучшую прямую

а по второй — прямую

Первую прямую мы можем записать в виде

Сравнивая коэффициенты при в двух последних уравнениях, находим, что эти коэффициенты равны в том и только в том случае, когда выполнено соотношение

т. е.

или, с учетом предыдущего, когда .

Что касается отрезков на осях, то они будут совпадать тогда и только тогда, когда

или

Но

так что

При получаем

В то же время,

так что при совпадают и отрезки на осях, т. е. наилучшая прямая одна и та же при обеих моделях наблюдений, и это есть прямая, на которой расположены все наблюдаемые точки

Иными словами, наилучшие прямые, построенные по двум альтернативным моделям, совпадают в том и только в том случае, когда все точки , расположены на одной прямой (так что ); при этом, . В противном случае, и подобранные «наилучшие» прямые имеют разные угловые коэффициенты.

Кстати, в рассмотренном нами примере с уровнями безработицы, диаграмма рассеяния с переставленными осями (соответствующими модели наблюдений ) имеет вид

Рис. 5

Количество точек с совпадающими знаками отклонений координат от средних значений равно 10 (4+ 6, с учетом совпадений), а число точек с противоположными знаками отклонений координат от средних значений равно 7 (4+3, с учетом совпадений). Соответственно, «облако точек» имеет некоторую вытянутость вдоль наклонной прямой, проведенной через «центр» облака. «Наилучшая» прямая имеет вид

коэффициент детерминации равен

Произведение угловых коэффициентов 0.125265 и 1.695402 наилучших прямых в «прямой» и «обратной» моделях наблюдений равно 0.212374 и совпадает со значением R².

Отметим, что несовпадение наилучших прямых, конечно, связано с тем, что в этих двух альтернативных моделях наблюдений мы минимизировали различные суммы квадратов: в «прямой» модели мы минимизировали сумму квадратов отклонений точек от подбираемой прямой в направлении, параллельном оси , а во втором — в направлении, параллельном оси .