Если имеется только один факторный признак, строится так называемая парная регрессия, выражающаяся уравнением прямой
Коэффициент регрессии а 1 показывает, на какую величину в среднем изменится результативный признак Y, если переменную Х увеличить на единицу ее собственного измерения.
Свободный член уравнения а 0 характеризует усредненное влияние неучтенных в модели факторов (определяет начальные условия развития).
Для нахождения параметров уравнения прямой воспользуемся методом наименьших квадратов.
Для расчета параметров линейного уравнения регрессии решим следующую систему нормальных уравнений:
После решения системы и нахождения параметров а 0 и а 1 данные параметры подставляют в уравнение прямой. Рассчитанные по этому уравнению значенияназываются теоретическими (выравненными) значениями у.
Пример 8.3 –Рассчитаем парный коэффициент корреляции и построим уравнение регрессии на основе следующих данных таблицы 8.3.
Таблица 8.3 - Стоимость основных фондов и выпуск продукции по группе заводов
|
|
Номер завода | Стоимость основных фондов, млн. р. (х) | Выпуск продукции, млн. р. (y) |
2,4 | ||
4,0 | ||
3,6 | ||
4,0 | ||
4,5 | ||
4,6 | ||
5,6 | ||
6,5 | ||
7,0 | ||
5,0 | ||
Итого | 47,2 |
Изобразим на графике координаты факторного и результативного признака точками, а затем соединим их между собой (рисунок 8.3).
Рисунок 8.3 – Поле корреляции
На поле корреляции появилась линия, которая по форме ближе всего к прямой.
Можно предположить, что между стоимостью основных фондов и выпуском продукции существует прямолинейная связь, которая выражается уравнением прямойДля определения параметров а 0и а 1,используя метод наименьших квадратов, необходимо решить следующую систему нормальных уравнений:
где п - численность совокупности (в нашем примере п = 10).
Проведем необходимые расчеты в следующей таблице 8.4.
Таблица 8.4 - Расчет параметров уравнения регрессии
Номер завода | Стоимость основных фондов, р. (х) | Выпуск продукции, р. (y) | |||
2,4 | 14,4 | 2,692 | |||
4,0 | 32,0 | 3,537 | |||
3,6 | 32,4 | 3,958 | |||
4,0 | 40,0 | 4,380 | |||
4,5 | 45,0 | 4,380 | |||
4,6 | 50,6 | 4,802 | |||
5,6 | 67,2 | 5,224 | |||
6,5 | 84,5 | 5,646 | |||
7,0 | 98,0 | 6,068 | |||
5,0 | 75,0 | 6,490 | |||
Итого | 47,2 | 539,1 | - |
Расчеты, проведенные в таблице 8.4, дали следующие результаты:
Следовательно, система уравнений для нахождения параметров прямой имеет вид:
Решим ее.
Каждый член обоих уравнений поделим на коэффициенты при а 0 и из второго уравнения вычтем первое:
|
|
1) 4,72 = а 0+ 10,8 а 1;
2) 4,99 = а 0 + 11,44 а 1; 0,27 = 0,64 а 1.
Определим параметр а 1:
Подставив значение а 1 в первое уравнение, получим:
4,72 = а 0 + 10,8 0,422, откуда а 0 = 0,16.
Параметр а 0 - свободный член уравнения: ух = 0,16, когда х = 0.
Получим:
а 0 = 0,16; а 1 = 0,422.
Параметр уравнения а 1 показывает, что с увеличением стоимости фондов на 1 млн р. выпуск продукции увеличивается в среднем на 0,422 млн р. Линейное уравнение корреляционной связи будет иметь следующий вид:
Подставляя в это уравнение значения х, получим:
1) при х = 6: у 6 = 0,16 + 0,422 6 = 2,692;
2) при х = 8: у 8 = 0,16 + 0,422 8 = 3,537 и т. д.
Эти значения называются выравненными. Они приведены в последней колонке таблицы 8.4.
Измерим тесноту связи между факторным и результативным признаками. Для расчета используем следующую формулу:
Расчет необходимых значений проведем в следующей таблице 8.5.
Связь между стоимостью основных фондов и выпуском продукции прямая и высокая.
Расчет коэффициента корреляции по следующей формуле даст такой же результат:
где
у - среднее квадратическое отклонение результативного признака;
х - среднее квадратическое отклонение факторного признака.
Таблица 8.5 - Расчет линейного коэффициента корреляции
Номер завода | х | y | ||||||
2,4 | -4,8 | -2,32 | 11,1,36 | 23,04 | 5,38 | 14,4 | ||
4,0 | -2,8 | -0,72 | 2,016 | 7,84 | 0,52 | 32,0 | ||
3,6 | -1,8 | -1,12 | 2,016 | 3,24 | 1,25 | 32,4 | ||
4,0 | -0,8 | -0,72 | 0,576 | 0,64 | 0,52 | 40,0 | ||
4,5 | -0,8 | -0,22 | 0,176 | 0,64 | 0,05 | 45,0 | ||
4,6 | 0,2 | -0,12 | -0,024 | 0,04 | 0,01 | 50,6 | ||
5,6 | 1,2 | 0,88 | 1,056 | 1,44 | 0,77 | 67,2 | ||
6,5 | 2,2 | 1,78 | 3,916 | 4,84 | 3,17 | 84,5 | ||
7,0 | 3,2 | 2,28 | 7,296 | 10,24 | 5,20 | 98,0 | ||
5,0 | 4,2 | 0,28 | 1,176 | 17,64 | 0,08 | 75,0 | ||
Итого | 47,2 | - | - | 29,340 | 69,60 | 16,96 | 539,1 |
По данным таблицы 8.5 проведем расчет:
Подставим необходимые данные в формулу
В случае нелинейной зависимости между признаками для измерения тесноты связи применяют корреляционное отношение, которое исчисляется по формуле
где у - фактические значения;
- среднее значение;
- теоретические (выравненные) значения переменной величины.
Корреляционное отношение по своему абсолютному значению может принимать значения в пределах от 0 до 1.