У попередньому параграфі зазначалося про важливість і складність статистичних моделей множинної регресії. У них поведінка відгуку визначається не одним, а двома і більше факторами. Для визначення значущості факторів застосовується двохфакторний дисперсійний аналіз. В його основі лежить така ж ідея, як і для однофакторного. Враховується, що сума взаємовпливу двох факторів не дорівнює сумі їх окремих взаємовпливів, оскільки фактори між собою є взаємопов’язані. Головний ефект фактора визначає частку впливу фактора на значення функції відгуку за рахунок зміни його значення.
Нехай потрібно дослідити вплив двох факторів А і В на випадкову величину Y. Задане число рівнів факторів відповідно p i m. Можна кожну пару рівнів факторів Аі (і= 1, 2 ,..., р) і Вj (j= 1, 2 ,…,m) вважати рівнем деякого узагальненого фактора (А+В) ij. Очевидно, що число рівнів фактора (А+В) ij дорівнює p× m. Результати спостережень наведені в табл. 9.4 (розглядається випадок, коли у кожній комірці вказано одне спостереження).
Таблиця 9.4
Результати спостережень
Фактор А | Фактор В | Cереднє групове за стрічкою Хі | |||||
В1 | В2 | ... | Вj | … | Bm | ||
А1 | Х11 | Х12 | … | Х1j | … | Х1m | |
А2 | Х21 | Х22 | … | Х2j | … | Х2m | |
... | ... | … | … | … | … | ... | … |
Аі | Хi1 | Хi2 | … | Хij | … | Хim | |
... | … | … | … | ... | … | ... | … |
Ар | Хp1 | Хp2 | … | Хpj | … | Хpm | |
Середнє групове за стовпцем | … | … |
Величини , і обчислюємо за формулами:
. (9.26)
Скориставшись однофакторним дисперсійним аналізом, а саме порівнюючи групові середні , можна зробити висновок про вплив фактора А на відгук Х. Аналогічно, порівнюючи групові , можна говорити про вплив фактора В. Встановити вплив об’єднаного фактора (А+В) на досліджувану змінну можна за дисперсіями sА і sВ.
Однак, для того щоб виявити вплив на Х кожного з факторів А і В окремо, необхідно розділити значення результуючого відгуку Х на групи за рівнями Окрема або тільки фактора А, або тільки фактора В.
Приймаємо гіпотезу про те, що випадкова величина Х не залежить від фактора А і від фактора В. Тобто зміна рівнів фактора А не порушує рівність а1=а2=...=ар, а зміна рівнів фактора В зберігає рівність b1=b2=…=bm (ai, bj – математичні сподівання випадкової величини Х на рівні Аі (і=1, 2,..., р) і Вj (j=1, 2,..., p) відповідно). Перевірити ці рівності можна у випадку, коли для різних комбінацій рівнів факторів А і В спостереження незалежні і відгук моделі Х має нормальний закон розподілу зі сталою величиною дисперсії s02. Їх перевірка здійснюється за допомогою F -розподілу Фішера.
Алгоритм двофакторного дисперсійного аналізу полягає у наступному:
1. Обчислюємо загальне середнє за формулою
. (9.27)
2. Обчислюємо загальну суму квадратів відхилень спостережуваних значень відгуку Х від загальної середньої
. (9.28)
3. Обчислюємо значення вибіркової дисперсії
. (9.29)
4. Обчислюємо суму квадратів різниць між середніми за рядками і загальним середнім. Величина SА характеризує зміну відгуку за фактором А
. (9.30)
5. Аналогічно обчислюємо величину SВ
. (9.31)
6. Знаходимо значення вибіркових дисперсій групових середніх і групових середніх :
. (9.32)
7. Обчислюємо залишкову суму квадратів, що характеризує вплив на Х неконтрольованих (залишкових) факторів
. (9.33)
8. Обчислюємо значення відповідних дисперсій:
(9.34)
9. Обчислюємо вибіркову дисперсію для оцінки параметра s02
. (9.35)
10. Обчислюємо спостерігаючі значення критерію Фішера для факто-
рів А і В:
. (9.36)
11. Для заданого рівня значимості α знаходимо правосторонню критичну точку Fкр (α, k 1, k 2). Використовуючи таблицю критичних точок F -розподілу (Додаток 4), знаходимо:
12. Порівнюємо значення FАспост і FАкр. Якщо:
· FАспост< FАкр, то вплив фактора А на відгук моделі Х не підтверджується;
· FАспост >FАкр, то знаходимо вибірковий коефіцієнт детермінації і робимо висновок про те, що вплив фактора А на відгук Х є значущим і становить загальної варіації.
13. Порівнюємо значення FВспост і FВкр. Якщо:
· FВспост< FВкр, то вплив фактора В на відгук моделі не підтверджується;
· FВспост >FВкр, то знаходимо . Фактор В є значущим і становить загальної варіації відгуку моделі.
Отримані показники варіації запишемо у дисперсійну таблицю (табл. 9.5)
Тепер можна перейти до вивчення технологій проведення регресійного і дисперсійного аналізів засобами GPSS World.
Таблиця 9.5
Показники двохфакторного дисперсійного аналізу
Джерело варіації спостережень | Показник варіації | Число степенів вільності | Незміщена оцінка дисперсії |
Фактор А | , якщо виконується а1=а2=...=ар | ||
Фактор В | , якщо виконується b1=b2=...=bm | ||
Загальна варіація | , якщо виконується а1=а2=...=ар b1=b2=...=bm |