Методические указания к выполнению работы

Краткая справка

Парной регрессией называется уравнение связи двух переменных y и x вида y = f (x), где y – зависимая переменная, функция; x –независимая переменная, аргумент. Различают линейные и нелинейные регрессии.

Линейная регрессия описывается уравнением ŷx = a + b · x.

Среди нелинейных регрессийнаиболее часто применяются следующие модели:

- гиперболическая ŷx = a + b/x;

- полиномиальная ŷx = a + b · x+ с · x2;

- показательная    ŷx = a · bx;

- степенная           ŷx = a · xb;

- экспоненциальная ŷx = a · еbx;

- логарифмическая ŷx = a + b ·ln x и др.

Построение уравнения регрессии. По имеющимся данным n наблюдений за совместным изменением двух параметров x и y {(xi, yi), i =1,2,…, n } необходимо определить аналитическую зависимость ŷx = f (x), наилучшим образом описывающую данные наблюдений.

Построение уравнения регрессии осуществляется в два этапа:

- спецификация модели (определение вида аналитической зависимости ŷx = f (x));

- оценка параметров выбранной модели.

Спецификация модели. Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве аргумента x в уравнении связи y = f (x).

Применяется три основных метода выбора аналитической зависимости:

- графический (на основе анализа поля корреляций);

- аналитический, т.е. исходя из теории изучаемой взаимосвязи;

- экспериментальный, т.е. путём сравнения средней ошибки аппроксимации Ā, рассчитанной для различных моделей регрессии (метод перебора).

Оценка параметров модели.  Для оценки параметров регрессий (a, b и c) используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений функции y от теоретических значений ŷx при тех же значениях аргумента x минимальна, т.е.

Оценка тесноты связи. Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции rxy для линейной регрессии
(-1 £ rxy £ 1) и индекс корреляции ρxy для нелинейной регрессии (0 £ ρxy £ 1). Коэффициент парной корреляции rxy вычисляется по формуле 

,

где  средние значения (функция Excel: =СРЗНАЧ(<диапазон>));

среднеквадратические отклонения (функция Excel:
=СТАНДОТКЛОН(<диапазон>)).

Индекс корреляции ρxy вычисляется по формуле

.

Долю дисперсии, объясняемую регрессией, в общей дисперсии переменной y характеризует коэффициент детерминации (для линейной регрессии) и индекс детерминации  (для нелинейной регрессии).

Коэффициент детерминации – квадрат коэффициента или индекса корреляции.Для оценки качества построенной модели регрессии можно использовать показатель (коэффициент, индекс) детерминации R2 либо среднюю ошибку аппроксимации .

Средняя ошибка аппроксимации – среднее относительное отклонение расчётных значений от фактических. Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.

Построенное уравнение регрессии считается удовлетворительным, если значение  не превышает 10-12%.

Оценка значимости уравнения регрессии. Оценка значимости всего уравнения регрессии в целом осуществляется с помощью F-критерия Фишера.

F -критерий Фишера заключается в проверке гипотезы Н0о статистической незначимости  уравнения регрессии. Для этого выполняется сравнение фактического F факт и критического (табличного) F maзначений F -критерия Фишера. F факт определяется по следующей формуле

где п - число измерений; т - число параметров при переменных.Для линейной регрессии т = 1.Для нелинейной регрессии вместо  используется R 2.

F ma-максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = т, k2 = п - т -1 (для линейной регрессии т = 1) и уровне значимости α.

Определяется функцией Excel: =FРАСПОБР(α; k1; k2).

Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α принимается равной 0,05 или 0,01.

Если F ma< F факт, то H0 -гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F ma> F факт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: