Так как корреляционная связь имеет вероятностный характер, то в процессе решения должна осуществляться проверка на типичность параметров уравнения. Проверку целесообразно проводить в том случае, если численность объектов анализа меньше 30.
3. Проверка значимости уравнения регрессии.
Если расчет производится по нескольким моделям, то выбирается такая модель, которая обеспечивает наибольшее соответствие фактических данных и результатов расчетов по данным модели. Такое соответствие проводится с использованием следующих показателей.
Средняя ошибка аппроксимации может быть вычислена по следующей формуле:
(7.1)
где: | Yi - Yxi | - разность линейных отклонений абсолютных величин эмпирических (фактических) Yi и выравненных Yxi по уравнению точек регрессии.
Возможна оценка типа связи по остаточной дисперсии, рассчитанной для каждой модели, аппроксимирующей зависимость результирующего признака от факторных признаков:
(7.2)
Нахождение параметров уравнения регрессии осуществляется методом наименьших квадратов. В основу этого метода положено требование минимизации сумм квадратов отклонений эмпирических данных Yi от выравненных Yxi, т.е. .
|
|
Регрессия может быть парная Y = f (X), если исследуется зависимость между результирующим и факторным признаком, и множественная, если число факторных признаков равно двум и более, т.е. Y = f (X1,X2,...Xк ).
Регрессионный анализ и корреляционный анализ тесно связаны, т.к. с помощью регрессионного анализа находится уравнение связи между признаками (уравнение регрессии), а с помощью корреляционного анализа оценивается теснота связи.
Корреляционно-регрессионной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы, влияющие на вариацию результативного признака, обладает значимыми коэффициентами детерминации и регрессии.
Показатели тесноты связи:
Коэффициент корреляции -показывает тесноту связи между переменными. В случае прямолинейной зависимости определяется линейный коэффициент корреляции r:
. 7.3)
Чем ближе коэффициент корреляции по абсолютному значению к единице, тем более тесная связь. Если коэффициент корреляции равен 0, то связи нет. О мере тесноты связи можно судить по шкале Чеддока.
Показания тесноты связи (значения линейного коэффициента корреляции) | |0,1...0,3| | |0,3…0,5| | |0,5…0,7| | |0,7…0,9| | |0,9…0,99| |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Коэффициент детерминации (детерминированности) r2 обычно выражается в процентах. Он показывает долю факторной дисперсии в общей дисперсии результативного признака.
|
|
При показании тесноты связи | r | < 0,7 величина коэффициента детерминации всегда меньше 50 процентов. Это означает, что факторный признак влияет на результативный не более, чем в 50 процентах случаев.
При небольшой статистической совокупности производится оценка значимости показателей по критериям Стьюдента или Фишера.
Для прямолинейной зависимости обычно применяют критерий Стьюдента. Расчетное значение критерия t r находится по формуле:
(7.4)
где n - количество членов изучаемой совокупности факторного признака.
По таблице Стьюдента или с использованием стандартной функции MS Excel СТЬЮДРАСПОБР(Значимость[1]; Число степеней свободы) находится критическое значение критерия tкрит с учетом заданного уровня значимости и числа степеней свободы, равных (n-2). При уровне значимости 0,05 доверительная вероятность равна 95%.
Пример использования стандартной функции MS Excel СТЬЮДРАСПОБР.
Для вызова функции в MS Excel необходимо активизировать меню Вставка, Формула и ввести исходные данные в открывшемся окне:
В результате выполнения функции будет получено табличное или критическое значение tкрит.
После получения результата необходимо сравнить расчетное tr и табличное (критическое) значение tкрит . Если tr > tкрит, то линейный коэффициент корреляции можно признать существенным (значимым), а связь между У и Х - реальной.
При нелинейных видах зависимости, а также в случае множественной регрессии производится оценка коэффициента детерминированности по критерию Фишера. Расчетное значение критерия F r находится по формуле:
(7.5)
где m - число параметров уравнения.
Fкрит находится с учетом принятого уровня значимости и числа степеней свободы k1=m-1 и k2=n-m по таблице Фишера или путем использования стандартной функции Excel FРАСПОБР(Значимость, Число степеней свободы k1, Число степеней свободы k2).
При Fr > Fкрит коэффициент корреляции можно признать значимым.
Для подтверждения гипотезы о наличии линейной связи можно воспользоваться оценкой значимости коэффициентов линейной регрессии, что является необходимым применительно к совокупностям, число наблюдений в которых не превышает 30. Расчетные (фактические) значения Т-критерия определяются для каждого из параметров модели.
Для параметра а0:
Для параметра а1 :
где
- значение затрат, вычисленное по модели (выравненных значений);
- среднее квадратическое отклонение результативного признака от выравненных значений, рассчитанных по модели;
- среднее квадратическое отклонение факторного признака х от общей средней.
Сравнение расчетных значений Т-критерия Стьюдента с табличными (теоретическими) проводится по методике, изложенной при проверке значимости коэффициента корреляции.
Если в силу особенностей исходных данных затруднения вызывает выбор адекватной регрессионной модели, то расчет осуществляется по нескольким моделям и производится оценка адекватности модели с использованием средней ошибки аппроксимации по формуле (7.1) и дальнейшая проверка значимости коэффициента корреляции или корреляционного отношения и параметров модели.
Содержание отчета
1. Исходные данные.
2. Расчетная часть.
3. Графики связи между факторами
4. Аналитическая записка
Примечание: Вследствие трудоемкости расчеты рекомендуется выполнять средствами вычислительной техники. Существуют специальные встроенные функции для корреляционно-регрессионного анализа в пакете прикладных программ EXCEL. Однако для получения более полной картины лучше применять специализированные статистические пакеты прикладных программ, например, STATISTICA, SPSS, STATGRAPHICS и др.