Корреляционный анализ в сильных шкалах

Для менеджера большинство решений, принятие которых строится на основе рассмотрения хозяйственных ситуаций весьма важно уметь анализировать причинно-следственные связи в организационных системах. Эффективным инструментом их описания является корреляционно-регрессионный анализ.

Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками при парной связи и между результативным и множеством факторных признаков при многофакторной связи.

Корреляционная зависимость – это зависимость случайных величин (признаков), при которой изменению среднего значения одной соответствует изменение среднего значения другой случайной величины.

Показатели тесноты связи между признаками называют коэффициентами корреляции. Знаки при коэффициентах корреляции характеризуют направление связи между признаками. Их выбор зависит от того, в каких шкалах измерены признаки. Напомним, что основными шкалами являются:

1) номинальная шкала (наименований) предназначена для описания принадлежности объектов к определенным социальным группам;

2) шкала порядка (ранговая) применяется для измерения упорядоченности объектов по одному или нескольким признакам;

3) количественная шкала используется для описания количественных показателей.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости. Расчет линейного коэффициента корреляции осуществляется по формуле , где - среднеквадратическое отклонение факторного признака . Значимость линейного коэффициента корреляции определяется с помощью t – критерия Сьюдента, но можно воспользоваться и упрощенным правилом: если , то связь практически отсутствует, если , то связь слабая, если , то связь достаточно сильная, если . То имеется высокая степень зависимости между признаками.

Проверка на значимость коэффициента корреляции. Выдвигаемые гипотезы следующие: . При справедливости нулевой гипотезы статистика критерия имеет - распределение Стьюдента с степенями свободы. Гипотеза отвергается, то есть выборочный коэффициент корреляции значимо отличается от нуля, если , где - табличное значение критерия Стьюдента, определенное на уровне значимости при числе степеней свободы . Доверительный интервал значимого коэффициента корреляции равен . Здесь - критическая точка стандартного нормального распределения, соответствующего уровню значимости , - объем выборки.

Пример. На основе выборочных данных о деятельности пяти предприятий одной из отраслей промышленности РФ оценить тесноту связи между трудоемкостью продукции предприятия (Х, чел.-час) и объемом ее производства (Y, млн руб.)

Объем произведенной продукции, млн руб., Y Затраты на 1000 изделий, чел.-час, Х YX
  33,2 0,15 4,980 1102,24 0,0225
  121,0 0,12 14,520 14641,00 0,0144
  99,5 0,11 10,945 9900,25 0,0121
  59,8 0,09 5,382 3576,04 0,0081
  80,3 0,08 6,424 6448,09 0,0064
Сумма 393,8 0,55 42,251 35667,62 0,0635
Средняя 78,76 0,11 8,450 7133,524 0,0127

Используя данные таблицы находим: . Проверим на значимость коэффициент корреляции. Статистик Стьюдента в нашем случае . При уровне значимости 0,05 и степени свободы 3 табличное значение = 2,353. Так как > = 2,353, то коэффициент корреляции не является значимым. Таким образом, не имеется зависимости между изучаемыми признаками. В MS Excel имеется функция КОРРЕЛ, которая возвращает коэффициент корреляции между двумя множествами данных.

Задание. Имеются данные по десяти заводам отрасли. Определить, существует ли корреляционная зависимость между стоимостью основных фондов и объемом выпуска продукции.

№ завода Стоимость основных фондов (млн руб.) Объем выпуска продукции (млн руб.)
    2,0
    1,2
    3,6
    6,8
    4,4
    3,8
    0,8
    2,2
    5,0
    4,6

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: