При построении аналитической таблицы независимый (факторный) признак расположить в строках таблицы, а зависимый перегруппировать во взаимосвязи с факторным. Провести корреляционно-регрессионный анализ:
а) построить поле корреляции;
б) рассчитать коэффициенты регрессии, эластичности. Сделать оценку уравнения регрессии, рассчитав среднюю квадратическую ошибку уравнения регрессии. Оценить значимость линии регрессии, выражающей связь между двумя признаками, сравнив среднюю квадратическую ошибку уравнения регрессии со средним квадратическим отклонением, рассчитанным по зависимому признаку;
в) рассчитать линейный коэффициент корреляции;
г) эмпирическое корреляционное отношение;
д) теоретическое корреляционное отношение;
е) коэффициент корреляции рангов Спирмэна;
ж) коэффициент ранговой корреляции Кендалла;
з) коэффициент Фехнера;
и) произвести оценку достоверности коэффициента корреляции по критерию Фишера (Приложение Д).
Для исследования зависимости между явлениями используют аналитическую группировку. При их построении можно установить взаимосвязь между двумя признаками и более. При этом факторными будут называться признаки, под воздействием которых изменяются результативные признаки. Представим аналитическую группировку в таблице 9.1.
|
|
Таблица 9.1 Аналитическая группировка
Объем продаж | Численность работников | Итого: | |||||
420-429 | 429-438 | 438-447 | 447-456 | 456-465 | 465-473 | ||
5100-5210 | 2 | 2 | |||||
5210-5320 | 1 | 5 | 6 | ||||
5320-5430 | 2 | 2 | 2 | 6 | |||
5430-5560 | 2 | 2 | 2 | 2 | 8 | ||
5560-5670 | 2 | 1 | 1 | 1 | 5 | ||
Итого: | 3 | 5 | 6 | 5 | 5 | 3 | 27 |
а) Корреляционную зависимость для наглядности можно изобразить графически. Для этого, имея n взаимосвязанных пар значений x и y, пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. А затем на фоне "корреляционного поля" строится средняя линия. Представим поле корреляции на рисунке 9.1.
Рисунок 9.1 Поле корреляции
Условные обозначения:
х - стаж по специальности;
у - средняя зарплата;
1 - линия тренда.
б) Уравнение линии, выбранной для выравнивания y, называется уравнением регрессии. Параметры уравнения регрессии а и а рассчитываются из системы уравнений, составленной по методу наименьших квадратов: Суть метода в том, что линия пройдет в максимальной близости от эмпирических точек.
где - зависимый признак; - коэффициенты уравнения прямой; - независимый признак; - число выборки.
Составим уравнение регрессии:
y=5207+13,7х
|
|
Средняя линия представлена на рисунке 9.1.
Рассчитаем коэффициент эластичности. Он показывает, на сколько процентов изменится в среднем результативный признак y при изменении факторного признака x на 1%. Этот коэффициент рассчитываться по формуле:
где - коэффициент эластичности;
- коэффициент при в уравнении прямой;
- среднее значение факторного признака;
- среднее значение зависимого признака.
Таким образом, при изменении численности рабочих на 1%, объем продаж изменится на 1,1%
в) Линейный коэффициент корреляции. Он строится на основе отклонения индивидуальных значений х и у от соответствующей средней величины и рассчитывается по формуле:
где - линейный коэффициент корреляции;
- среднее произведение факторного признака на зависимый;
- произведение факторного признака на зависимый;
- простая средняя арифметическая факторного признака;
- простая средняя арифметическая зависимого признака;
- среднее квадратическое отклонение по зависимому признаку;
- среднее квадратическое отклонение по факторному признаку.
Найдем среднюю из произведений ху:
Теперь можно найти непосредственно линейный коэффициент корреляции:
Этот коэффициент свидетельствует о том, что между известными признаками существует прямая связь, т.е. при увеличении числености аботников объем продаж увеличивается.
г) Эмпирическое корреляционное отношение.
С его помощью можно измерить тесноту связи. Этот коэффициент рассчитывается по формуле:
Таким образом, в нашем случае эмпирическое корреляционное отношение равно:
Полученное значение характеризует тесноту связи близкую к максимальной, значит можно сделать вывод о наличии существенной связи между уровнем объема продаж и численности работников.
д) Рассчитаем теоретическое корреляционное отношение:
где - теоретическое корреляционное отношение; - общая дисперсия зависимого признака по несгруппированным данным;
- остаточная дисперсия;
- теоретическое значение;
- простая средняя арифметическая эмпирического ряда;
- численность совокупности.
Для этого сделаем расчет следующих параметров (Таблица 9.2):
Таблица 9.2
Расчет среднеквадратичного отклонения теоретических значений от средней эмпирического ряда
Численность рабочих | Теоретические значения | - | ( - ) 2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
| -179 279 219 174 51 66 73 49 9 24 128 87 79 51 11 41 57 41 71 61 36 89 161 197 154 251 251 | 32041 77841 47961 30276 2601 4356 5329 2401 81 576 16384 7569 6241 2601 121 1681 3249 1681 5041 3721 1296 7921 25921 38809 23716 63001 63001 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
Итого: | 475417 |
Найдем остаточную дисперсию:
Рассчитаем теоретическое корреляционное отношение:
Итак, теоретическое корреляционное отношение равно 1, следовательно, между коррелируемыми величинами существует большая зависимость.
е) Коэффициент корреляции Спирмэна. Для расчета этого коэффициента необходимо привести таблицу корреляции рангов (таблица 9.3).
Таблица 9.3 Корреляция рангов
х | Rx | Rxy | y | Ry | Rxy | d | знаки | |
х | у | |||||||
424 | 3 | 3 | 5220 | 3 | 3 | 0 | - | - |
422 | 1 | 1 | 5120 | 1 | 1 | 0 | + | + |
433 | 5 | 5 | 5180 | 2 | 2 | 3 | - | - |
446 | 14 | 14 | 5225 | 4 | 4 | 10 | + | + |
455 | 17 | 17 | 5450 | 18 | 18 | -1 | - | - |
432 | 4 | 4 | 5465 | 21 | 21 | -17 | + | + |
443 | 10 | 10 | 5326 | 9 | 9 | 1 | - | - |
434 | 6 | 6 | 5350 | 11 | 11 | -5 | + | + |
437 | 7 | 7 | 5390 | 13 | 13 | -5 | - | - |
438 | 8 | 8 | 5375 | 12 | 12 | -4 | + | + |
444 | 12 | 12 | 5271 | 5 | 5 | 7 | - | - |
423 | 2 | 2 | 5312 | 7 | 7 | -5 | + | + |
442 | 9 | 9 | 5320 | 8 | 8 | 1 | - | - |
444 | 13 | 13 | 5348 | 10 | 10 | 3 | + | + |
443 | 11 | 11 | 5410 | 14 | 14 | -3 | - | - |
455 | 18 | 18 | 5440 | 16 | 16 | 2 | + | + |
452 | 16 | 16 | 5456 | 19 | 19 | -3 | - | - |
457 | 20 | 20 | 5440 | 17 | 17 | 3 | + | + |
455 | 19 | 19 | 5470 | 22 | 22 | -3 | - | - |
450 | 15 | 15 | 5460 | 20 | 20 | -5 | + | + |
462 | 22 | 22 | 5435 | 15 | 15 | 7 | - | - |
462 | 23 | 23 | 5310 | 6 | 6 | 17 | + | + |
464 | 24 | 24 | 5560 | 24 | 24 | 0 | - | - |
460 | 21 | 21 | 5596 | 25 | 25 | -4 | + | + |
471 | 26 | 26 | 5553 | 23 | 23 | 3 | + | + |
472 | 27 | 27 | 5650 | 26 | 26 | 1 | + | + |
470 | 25 | 25 | 5650 | 27 | 27 | -2 |
|
|
Ранг - это порядковый номер, присеваемый каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать в одном и том же порядке: от меньших значений к большим и наоборот. Если встречается несколько одинаковых значений признака, то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений.
Коэффициент корреляции рангов Спирмена:
где - коэффициент корреляции рангов Спирмена;
- разность между расчетными рангами в двух рядах;
- численность совокупности.
Таблица 9.4 Расчетная таблица для определения коэффициента корреляции Спирмэна
х | y | d | d2 | P | Q |
424 | 5220 | 0 | 0 | 22 | 3 |
422 | 5120 | 0 | 0 | 12 | 12 |
433 | 5180 | 3 | 9 | 21 | 2 |
446 | 5225 | 10 | 100 | 11 | 11 |
455 | 5450 | -1 | 1 | 17 | 2 |
432 | 5465 | -17 | 289 | 10 | 10 |
443 | 5326 | 1 | 1 | 18 | 0 |
434 | 5350 | -5 | 25 | 8 | 9 |
437 | 5390 | -5 | 25 | 15 | 1 |
438 | 5375 | -4 | 16 | 8 | 8 |
444 | 5271 | 7 | 49 | 15 | 0 |
423 | 5312 | -5 | 25 | 6 | 7 |
442 | 5320 | 1 | 1 | 13 | 0 |
444 | 5348 | 3 | 9 | 6 | 6 |
443 | 5410 | -3 | 9 | 10 | 1 |
455 | 5440 | 2 | 4 | 5 | 5 |
452 | 5456 | -3 | 9 | 8 | 1 |
457 | 5440 | 3 | 9 | 4 | 4 |
455 | 5470 | -3 | 9 | 7 | 0 |
450 | 5460 | -5 | 25 | 3 | 3 |
462 | 5435 | 7 | 49 | 3 | 0 |
462 | 5310 | 17 | 289 | 1 | 3 |
464 | 5560 | 0 | 0 | 2 | 0 |
460 | 5596 | -4 | 16 | 0 | 2 |
471 | 5553 | 3 | 9 | 1 | 0 |
472 | 5650 | 1 | 1 | 0 | 0 |
470 | 5650 | -2 | 4 | 226 | 90 |
Итого: | 581 |
Теперь рассчитаем непосредственно коэффициент корреляции Спирмэна.
Полученное значение коэффициента свидетельствует о сильной прямой связи между признаками.
ж) Коэффициент корреляции рангов Кендалла:
где - коэффициент Кенделла;
- сумма значений рангов, расположенных ниже соответствующего порядкового номера ранга и больше его;
- сумма значений рангов, расположенных ниже соответствующего порядкового номера ранга и меньше его;
|
|
- численность совокупности.
Рассчитаем коэффициент корреляции Кендела, используя данные таблицы 9.4
з) Теперь рассчитаем коэффициент Фехнера:
где - коэффициент Фехнера;
- число совпадений знаков;
- число несовпадений знаков.
Рассчитаем коэффициент Фехнера, используя данные таблицы 9.4.
Полученное значение рангового коэффициента корреляции Фехнера характеризует довольно большую тесноту связи между изменением объема продаж и численности работников.
и) Критерий Фишера. Он рассчитывается по результативному признаку и осуществляет оценку достоверности коэффициента корреляции:
где - коэффициент Фишера;
- межгрупповая дисперсия;
- количество групп;
- средняя из внутригрупповых дисперсий;
- численность совокупности.
Критерий Фишера сравнивается с его теоретическим значением; в нашем случае Fтеор=5,79
Таким образом, расчетное значение критерия Фишера больше теоретического, значит коэффициент корреляции достоверен.