Предположим, что объем отгруженной инновационной продукции в Новосибирской области зависит от величины инвестиций в инновационную деятельность. Проверим это предположение с помощью корреляционно-регрессионного анализа (КРА).
Этапы анализа:
1. Постановка цели исследования.
Определить наличие или отсутствие зависимости между показателями величины инвестиций в инновационную деятельность и объема отгруженной инновационной продукции. Построить регрессионную модель этой зависимости, проверить её качество и использовать эту модель для анализа и прогнозирования.
2. Сбор исходной статистической информации.
Информацию для исследования находим в статистических ежегодниках. Представим данные в табличной форме (табл. 2.8).
Таблица 2.8 Исходная информация для КРА
| Годы | Объем инвестиций, млн. руб. | Объем отгруженной инновационной продукции, млн. руб. |
| 2000 | 205,6 | 784,8 |
| 2001 | 687,4 | 1384,0 |
| 2002 | 662,1 | 1016,4 |
| 2003 | 638,2 | 1548,2 |
| 2004 | 273,3 | 1555,7 |
| 2005 | 278,6 | 1630,2 |
| 2006 | 361,2 | 1676,0 |
| 2007 | 398,1 | 1900,1 |
| 2008 | 431,6 | 2032,4 |
| 2009 | 620,2 | 2864,8 |
Введем обозначения: xi – объем инвестиций, yi – объем отгруженной инновационной продукции. Графически зависимость исходных данных представлена на рисунке 2.6.

Рис.2.1. Зависимость объема отгруженной инновационной продукции от объема инвестиций
3. Оценка тесноты связи между признаками.
3.1. Предположим, что изучаемые признаки связаны линейной зависимостью. Рассчитаем линейный коэффициент корреляции по формуле:
Промежуточные расчеты представлены в таблице 2.9.
Таблица 2.9 Промежуточные расчеты для определения параметров регрессии
| Годы | xi | yi | xy | x2 | y2 |
| 2000 | 205,6 | 784,8 | 161354,9 | 42271,36 | 615911,0 |
| 2001 | 687,4 | 1384,0 | 951361,6 | 472518,76 | 1915456,0 |
| 2002 | 662,1 | 1016,4 | 672958,4 | 438376,41 | 1033069,0 |
| 2003 | 638,2 | 1548,2 | 988061,2 | 407299,24 | 2396923,2 |
| 2004 | 273,3 | 1555,7 | 425172,8 | 74692,89 | 2420202,5 |
| 2005 | 278,6 | 1630,2 | 454173,7 | 77617,96 | 2657552,0 |
| 2006 | 361,2 | 1676,0 | 605371,2 | 130465,44 | 2808976,0 |
| 2007 | 398,1 | 1900,1 | 756424,1 | 158483,61 | 3610325,7 |
| 2008 | 431,6 | 2032,4 | 877191,5 | 186278,56 | 4130722,3 |
| 2009 | 620,2 | 2864,8 | 1776718 | 384648,04 | 8206792,6 |
| ∑ | 4556,3 | 16392,6 | 7668788 | 2372652,27 | 29795930,4 |







Коэффициент линейной корреляции, равный 0,215, свидетельствует о наличии прямой связи между объемом инвестиций и объемом отгруженной инновационной продукции, но недостаточно тесной.
3.2 Оценка существенности коэффициента корреляции
Для этого найдем расчетное значение t-критерия Стьюдента:

По таблице критических точек распределения Стьюдента найдем tкр при уровне значимости α=0,05 и числе степеней свободы
ν = n-k-1 = 10-1-1=8. tкр = 2,306. Так как tрасч < tкр (0,622 < 2,306), то линейный коэффициент не считается значимым, а связь между x и y не является существенной, а обусловлена действием случайных причин.
4. Построение уравнения регрессии.
Этап построения регрессионного уравнения состоит в идентификации (оценке) его параметров, оценке их значимости и значимости уравнения в целом.
4.1. Идентификация регрессии. Построим линейную однофакторную регрессионную модель вида
Для оценки неизвестных параметров a0, a1 используется метод наименьших квадратов, заключающийся в минимизации суммы квадратов отклонений теоретических значений зависимой переменной от наблюдаемых (эмпирических).
Система нормальных уравнений для нахождения параметров a0, a1 имеет вид:
После преобразования системы получим:

Решением системы являются значения параметров:
а0 = 1332,36; a1 = 0,67.
Уравнение регрессии:
Коэффициент детерминации: 

Рис.2.2. Графическое представление уравнения регрессии
Таким образом, судя по регрессионному коэффициенту а1=0,67, можно утверждать, что с увеличением инвестиций на 1 млрд. рублей объем отгруженной инновационной продукции в рублях увеличивается в среднем на 670 млн. рублей в год. Для удобства интерпретации параметра а1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:

В рассматриваемом примере
Следовательно с возрастанием инвестиций на 1% следует ожидать повышения объема инновационной продукции на 0,19%.
Коэффициент регрессии а0=1332,36 учитывает влияние факторов, неучтенных в модели. В нашем случае влияние неучтенных факторов достаточно велико.
Коэффициент детерминации
показывает, что 4,6% вариации признака «объем отгруженной инновационной продукции» обусловлено вариацией признака «объем инвестиций», а остальные 95,4% вариации связаны с воздействием неучтенных факторов: уровень развития производства на период начала инвестиций, кадровый потенциал, целевое использование средств и другие.
4.2 Проверка значимости параметров регрессии.
Для того, чтобы оценить на сколько параметры а1, а0 отображают исследуемый процесс и не являются ли эти значения результатом случайных величин, рассчитаем средние ошибки и t-критерии Стьюдента.

По таблице критических точек распределения Стьюдента найдем tкр при уровне значимости α=0,05 и числе степеней свободы ν = 8. tкр = 2,306. Так как tа0расч > tкр (7,13 > 2,306), то параметр а0 считается значимым. Так как tа1расч < tкр (0,62 < 2,36), то параметр а1 не считается значимым.
4.3. Проверка значимости уравнения регрессии в целом.

По таблице критических значений критерия Фишера найдем Fкр=5,32 (при α=0,05, ν1=k=1, ν2=n-k-1=8). Так как Fрасч < Fкр (0,386 < 5,32), то для уровня значимости α=0,05 и числе степеней свободы ν1=1, ν2=8 построенное уравнение регрессии нельзя считать значимым.
5. Многофакторный корреляционный и регрессионный анализ
Проведем многофакторный корреляционный и регрессионный анализ. Представим данные в табличной форме (табл. 2.10).
Таблица 2.10 Исходная информация для КРА
| Годы | Объем инвестиций, млн. руб. | Число инновационно-активных предприятий, шт. | Объем отгруженной инновационной продукции, млн. руб. | |
| 2000 | 205,6 | 32 | 784,8 | |
| 2001 | 687,4 | 34 | 1384,0 | |
| 2002 | 662,1 | 32 | 1016,4 | |
| 2003 | 638,2 | 36 | 1548,2 | |
| 2004 | 273,3 | 33 | 1555,7 | |
| 2005 | 278,6 | 31 | 1630,2 | |
| 2006 | 361,2 | 34 | 1676,0 | |
| 2007 | 398,1 | 36 | 1900,1 | |
| 2008 | 431,6 | 38 | 2032,4 | |
| 2009 | 620,2 | 44 | 2864,8 |
Введем обозначения: x1i – объем инвестиций, x2i – число инновационно-активных предприятий, yi – объем отгруженной инновационной продукции.
Считая зависимость между этими показателями линейной, определим уравнение связи, вычислим множественные и частные коэффициенты корреляции и оценим значимость модели.
Промежуточные расчеты представлены в таблице 2.11.
Таблица 2.11 Промежуточные расчеты для определения параметров регресси
| Годы | x1i | x2i | yi |
| x2 | x2 |
| y2 | x1i y | x2i y | x1i x2i | |||
| 2000 | 205,6 | 32 | 784,8 |
| 42271,36 | 1024 |
| 615911 | 161354 | 25113 | 6579 | |||
| 2001 | 687,4 | 34 | 1384,0 |
| 472518,7 | 1156 |
| 1915456 | 951361 | 47056 | 23371 | |||
| 2002 | 662,1 | 32 | 1016,4 |
| 438376,4 | 1024 |
| 1033069 | 672958 | 32524 | 21187 | |||
| 2003 | 638,2 | 36 | 1548,2 |
| 407299,2 | 1296 |
| 2396923 | 988061 | 55735 | 22975 | |||
| 2004 | 273,3 | 33 | 1555,7 |
| 74692,89 | 1089 |
| 2420202 | 425172 | 51338 | 9018 | |||
| 2005 | 278,6 | 31 | 1630,2 |
| 77617,96 | 961 |
| 2657552 | 454173 | 50536 | 8636 | |||
| 2006 | 361,2 | 34 | 1676,0 |
| 130465,4 | 1156 |
| 2808976 | 605371 | 56984 | 12280 | |||
| 2007 | 398,1 | 36 | 1900,1 |
| 158483,6 | 1296 |
| 3610380 | 756429 | 68403 | 14331,6 | |||
| 2008 | 431,6 | 38 | 2032,4 |
| 186278,5 | 1444 |
| 4130650 | 877183 | 77231 | 16400 | |||
| 2009 | 620,2 | 44 | 2864,8 |
| 384648,0 | 1936 |
| 8207079 | 1776749 | 126051 | 27288 | |||
| ∑ | 4556 | 350 | 16392,6 |
| 2372652 | 12382 |
| 29796199 | 7668817 | 590973 | 162070 |
Парные коэффициенты корреляции:



Частные коэффициенты корреляции:



Коэффициент множественной корреляции:

Совокупный коэффициент множественной детерминации:
.Он показывает, что вариация объема инновационного продукта на 79,2 % обусловливается двумя анализируемыми факторами.
Система нормальных уравнений имеет вид:
Решением системы являются значения параметров:
а0 = 1332,36; a1 = 0,67.
Уравнение регрессии:
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:

По таблице критических значений критерия Фишера найдем Fкр=5,32 (при α=0,05, ν1=m-1=1, ν2=n-m=8). Так как Fрасч > Fкр (39,6 > 5,32), то для уровня значимости α=0,05 и числе степеней свободы ν1=1, ν2=8 построенное уравнение регрессии можно считать значимым.






