Регрессионный анализ

Линейный регрессионный анализ заключается в подборе графика и его уравнения для набора наблюдений. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных.

В регрессионном анализе рассматривают:

1) линейную относительно параметров регрессию:

а) парную линейную (у = а0+bх),

б) парную криволинейную (например, у = а0+bх+сх2,
y = а0+bsinx),

в) множественную линейную (y = а0 +∑bjxj)

Максимальное число необходимых переменных Х равно 16.

г) множественную нелинейную (например, для случая двух переменных Y(X1, X2) = а01 X1 + а2 X2+ а3 X12+ а4 X22+ а5 X1 X2

формируется диапазон, содержащий X12, X22, X1*X2, рядом с диапазоном переменных X1, X2),

2) нелинейную относительно параметров регрессию (например, у = а+bесх).

Пакет анализа подбирает линейную функцию с помощью методов наименьших квадратов (МНК). Основные параметры диалогового окна: входной интервал Y – диапазон анализируемых зависимых данных (диапазон должен состоять из одного столбца); входной интервал X – диапазон независимых данных (находящихся в соседних столбцах), подлежащих анализу, Excel располагает независимые переменные этого диапазона слева направо в порядке возрастания.

Экспериментальные данные аппроксимируются линейным уравнением до 16 порядка:

Y = а0 + alXl + а2Х2 +... + а16Х16, а0, al, а2…. а16 – искомые коэффициенты регрессии. Для получения коэффициентов регрессии необходимо:

а) выполнить команду Сервис>Анализ данных;

б) в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать строку Регрессия, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК;

в) в появившемся диалоговом окне задать Входной интервал У, т. е. ввести ссылку на диапазон анализируемых зависимых данных, содержащий один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку столбца зависимых данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

г) указать Входной интервал X, т. е. ввести ссылку на диапазон независимых данных, содержащий до 16 столбцов анализируемых данных. Для этого следует навести указатель мыши в поле ввода Входной интервал X и щелкнуть левой кнопкой мыши, затем навести указатель мыши на верхнюю левую ячейку диапазона независимых данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

д) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные;

е) нажимается кнопка ОК.

Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.

Интерпретация результатов. Значения коэффициентов регрессии находятся в столбце Коэффициенты и соответствуют:

Y-пересечение - а0;

Переменная Х1 - al;

Переменная Х2 - а2, и т. д.

В столбце Р-Значение приводится достоверность отличия (уровень значимости) соответствующих коэффициентов от нуля. В случаях, когда Р >0,05, коэффициент может считаться нулевым; это означает, что соответствующая независимая переменная практически не влияет на зависимую переменную.

Приводимое значение R-квадрат характеризует, с какой степенью точности полученное регрессионное уравнение аппроксимирует исходные данные. Если R-квадрат> 0,95, говорят о высокой точности аппроксимации (модель хорошо описывает явление). Если R-квадрат лежит в диапазоне от 0,8 до 0,95, говорят об удовлетворительной аппроксимации (модель в целом адекватна описываемому явлению). Если R-квадрат< 0,6, принято считать, что точность аппроксимации недостаточна и модель требует улучшения (введения новых независимых переменных, учета нелинейностей и т. д.).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: