Трохи теорії

Прості парні лінійні регресійні моделі встановлюють лінійну залежність між двома змінними. При цьому одна з них вважається залежною змінною – у та розглядається як функція від незалежної змінної – х.

У загальному вигляді проста модель парної регресії записується таким чином: y = β₀+ β₁x + u,де y - результативна змінна; х - факторна змінна; u – стохастична складова, яка вводиться до моделі з метою урахувати наявність впливу факторів, які не входять до моделі, β₀, β₁ – параметри моделі, а проста вибіркова регресійна модель - = b₀+ b₁x, де b₀ та b₁ – оцінки параметрів моделі.

Щоб мати явний вигляд залежності, необхідно знайти (оцінити) невідомі параметри b₀ та b₁ цієї моделі.

Згідно з гіпотезою про лінійний зв’язок через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться своїми параметрами b₀ та b₁. Щоб певна пряма адекватно описувала фактичну залежність, необхідно обрати такий метод оцінювання параметрів моделі, щоб відхилення фактичних значень від розрахункових били мінімальними.

У цьому разі мінімізації підлягає сума квадратів відхилень: , де - фактичне значення змінної у, - розрахункове значення змінної у. Це є суттю методу найменших квадратів. Необхідна умова для цього в рівних нулю частинних похідних цієї функції за кожною з оцінок параметрів b₀ та b₁. Виконавши елементарні перетворення, дістанемо систему нормальних рівнянь:

Розв’язавши цю систему ми отримаємо формули, на основі яких можна обчислити значення оцінок параметрів b₀ та b₁:

Остання формула випливає не з системи рівнянь, а з суті методу найменших квадратів. Оцінки найменших квадратів такі, що лінія регресії обов’язково проходить через точку . Підставивши середні значення змінних в рівняння регресії, ми знайдемо оцінку параметра b₀.

Знай ти оцінки параметрів лінії регресії b₁ та b₀ можна, використавши функції ЛИНЕЙН (значення змінної у; значення змінної х) та ОТРЕЗОК (значення змінної у; значення змінної х) відповідно. Модель лінійного регресійного рівняння можна трактувати як пряму на площині, де b₀ – перетин з віссю ординат, а b₁ – нахил.

Параметр b₁ вказує на скільки одиниць у середньому зміниться у зі зміною х на одиницю, а параметр b₀ характеризує значення у, при х = 0 (за умови, що змінна х може набувати нульових значень). Якщо вільний член b ₀ ≠ 0, то величина у не є строго пропорційною до х.

Еластичність у щодо х визначається коефіцієнтом еластичності

Значення цього коефіцієнта слід тлумачити так: при збільшенні х на 1% у гранично зросте на Е %.

Параметри регресії у невеликих за обсягом сукупностях здатні до випадкових коливань. Тому здійснюють перевірку їх істотності або статистичної значимості за допомогою t –критерію Стьюдента:

де оцінки дисперсій помилок та параметрів відповідно; значення критерію для кожного з параметрів.

Критичне значення критерію Стьюдента для рівня значимості α = 0,05 (задається дослідником) та n - k ступенів вільності (k – кількість параметрів) знаходимо за допомогою таблиць t – розподілу Стьюдента. Якщо t_кр.< t_фак _., то коефіцієнт регресії вважається статистично значимим, тобто з ймовірністю 0,95 вплив х на визнається істотним.

Для того, щоб визначити, як оцінки параметрів пов’язані з параметрами, потрібно побудувати інтервали довіри для параметрів узагальненої регресійної моделі, тобто інтервали в які з заданою ймовірністю потрапляють β₀ та β₁.

Довірчі межі коефіцієнта регресії: зі ймовірністю 0,95.

Довірчі межі вільного члена: зі ймовірністю 0,95.

Щоб відповісти на питання наскільки значним є вплив змінної х на у, знайдемо значення коефіцієнта кореляції, яке знаходиться між –1 та +1:

Якщо значення лінійного коефіцієнта кореляції близьке до одиниці і r >0, то можна зробити висновок про досить тісний прямий зв’язок між х та у. І навпаки. Якщо r <0, то зв’язок між ознаками зворотній.

Загальну дисперсію результативної ознаки можна розкласти на дві частини - дисперсію, що пояснює регресію, та дисперсію помилок:

Поділивши обидві частини на загальну дисперсію, отримаємо:

Перша частина цього виразу являє собою частину дисперсії, яку не можна пояснити через регресійний зв’язок, друга - частину дисперсії, яку можна пояснити, виходячи з регресії. Вона називається коефіцієнтом детермінації і використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної:

Для лінійного зв’язку

Якщо значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна. (). Варіація у на 100 R % залежить від варіації х, і на (100 - 100 R)% від варіації інших факторів, які не враховуються в моделі..

Інший критерій адекватності моделі – критерій Фішера. Він використовується найчастіше і дає відповідь на питання щодо адекватності моделі, коли значення коефіцієнта детермінації має не явно виражене граничне значення, наприклад, 0,5; 0,45; 0,44 і ін.

Перевірка моделі на адекватність за F – критерієм Фішера складається з таких етапів:

1. Розраховуємо величину F – критерію:

В цій формулі n, k – кількість спостережень та кількість параметрів відповідно.

2. Задаємо рівень значимості, наприклад, α = 0,05. Тобто, ми вважатимемо, що можлива помилка для нас становить 0,05, це означає, що ми можемо помилитися не більш, ніж у 5 % випадків, а в 95 % випадків наші висновки будуть правильними.

3. На цьому етапі за статистичними таблицями F – розподілу Фішера з (k - 1, n - k) ступенями вільності та рівнем значимості 100(1 - α)% знаходимо критичне значення. Якщо F_кр < F_факт, то зі ймовірністю 0,95 ми стверджуємо, що побудована нами модель є адекватною. Або навпаки, якщо F_кр > F_факт.

Якщо побудована модель виявилася адекватною, то ми можемо використовувати її для знаходження прогнозних значень результативної змінної. Прогнози ми можемо отримати двох видів: точковий – дає значення змінної для відповідного значення з побудованої вибіркової моделі: ; інтервальний .

При цьому, виходячи з узагальненої моделі, дійсне значення для прогнозного періоду буде дорівнювати:

Дійсне значення результату ми знайти не можемо, а можемо лише оцінити його за допомогою прогнозу.

Отже, прогнозне значення є оцінкою дійсного значення змінної y_n₊ ₁. Таким чином з нашої вибіркової моделі ми легко можемо знаходити будь-яке прогнозне значення. Виходячи з отриманого точкового прогнозу можна побудувати інтервали довіри для його дійсного значення. Такий інтервал довіри при заданому рівні значимості α = 0,05 для y_n₊ ₁ знаходять за формулою:

На практиці більш важлива побудова інтервалів довіри для математичного сподівання y_n₊ ₁,тобто побудова інтервалів довіри для

В цьому випадку формула модифікується:

Важливою задачею є вибір раціонального типу економетричної моделі. Конкретна аналітична форма зв’язку між економічними показниками згідно з простою економетричною моделлю вибирається на підставі змістовного тлумачення цього зв’язку.

Якщо економетрична модель вимірює зв’язок між двома змінними, то кожну пару спостережень над цими змінними можна зобразити у двовимірній системі координат. Аналіз зображеної множини точок дозволяє зробити висновок про наявність чи відсутність зв’язку між економічними показниками, обрати для характеристики даної залежності ту чи іншу функцію. Для побудови кореляційного поля – множини точок, координатами яких є відповідні значення змінних х та у використовують Мастер диаграмм. Розглянемо порядок побудови кореляційного поля точок:

- активізувати вікно Мастера диаграмм;

- в категорії Стандартные вибрати тип діаграми Точечная та вид №1 і натиснути клавішу Далее > (в нижній області вікна Мастера диаграмм);

- задати діапазон даних, які будуть використані для побудови графіка. Для цього виділити Диапазон данных і в стрічці Диапазон задати діапазон даних: натиснути клавішу Ctrl і, не відпускаючи її, виділити потрібні для побудови значення змінних;

- визначити кількість графіків, які будуть побудовані в одній системі координат та задати значення абсцис і ординат. Для цього виділити Ряд, натиснути клавішу Добавить, ввести значення змінної х та змінної у, ввести назву побудованого графіка. Натиснути клавішу Далее >;

- в діалоговому вікні Мастера диаграмм задати бажані позначення на діаграмі. Натиснути клавішу Далее >;

- в діалоговому вікні Мастера диаграмм задати розміщення діаграми на окремому листі. Натиснути клавішу Готово.