Этап 3. Спецификация модели (определение формы взаимосвязи между признаками Y и X или выбор уравнения регрессиии)

3.1. По величине выборочного коэффициента корреляции rxy определяется, возможна ли апроксимация наблюдаемых данных линейной моделью:

при - несомненная линейная связь (далее этапы IV, V и VI);

при - возможна линейная модель, окончательный ответ дает проверка модели на адекватность (далее этапы IV, V; если модель адекватна – идти на этап VI, иначе возврат на этап III (п. 3.2.));

при - линейное уравнение не пригодно, т.к. линейная связь слаба. Нужно предполагать нелинейную связь (см. п.3.2.).

3.2. Визуальный анализ корреляционного поля или вид эмпирической ломаной линии регрессии позволяют определить форму плавной кривой, определяющую основную тенденцию статистической зависимости. Если выбранная нелинейная модель окажется в дальнейшем неадекватной, то делается попытка подбора иной модели. Может оказаться, что модель, пригодную для практических целей, не построить, если имеется слабая корреляционная связь.

3.3. Компьютерный подбор модели – для всех известных моделей по МНК подбираются параметры. Все модели проверяются на адекватность. Среди адекватных моделей выбираются лучшая – та, у которой самый высокий показатель Fрасч. Выбор лучшей модели можно вести по коэффициенту детерминации R2 или любому другому универсальному показателю тесноты связи.

Этап 4. Параметризация модели (оценка параметров выбранного уравнения регрессии по методу наименьших квадратов).

Параметры уравнения регрессии по МНК подбираются таким образом, чтобы график линии регрессии располагался на минимальном удалении от точек исходных данных (сумма квадратов отклонений фактических значений от значений результатирующей переменной, вычисленной по уравнению регрессии должна быть минимальной). МНК применяется как для линейных, так и нелинейных моделей и подробно описан в статистической литературе.

Этап 5. Проверка модели на адекватность.

Проверка осуществляется по критерию Фишера. В адекватной модели остаточная компонента является случайной величиной с нормальным законом распределения. В этом случае показатель Fрасч , характеризующий отношение объясненной дисперсии к остаточной, подчиняется распределению Фишера и в случае адекватности модели дает значение, большее Fтабл.

Этап 6. Прогнозирование по модели.

Прогноз значений исследуемого показателя может быть точечным, а может быть и интервальным.

Точечный прогноз осуществляется прямой подстановкой интересующего нас значения фактора-признака X, отличного от выборочных данных, в уравнение регрессии.

При определении интервального прогноза рассчитывают доверительный интервал, куда среднее значение прогнозируемого показателя Y, соответствующее интересующей нас точке X, попадает с некоторой заранее заданной доверительной вероятностью r прогноза. Большей надежности прогноза будет отвечать более широкий интервал.

2.2.Регрессионные модели с одним уравнением: множественная регрессия


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: