Моделі дисперсного аналізу і їх характеристики

 

Дисперсійний аналіз - це cтатистичний метод, що дозволяє аналізувати вплив різних факторів на досліджувану змінну, тобто на показники технологічної операції з метою побудови її моделі.

Його метою є перевірка значимості розходження між середніми за допомогою порівняння дисперсій. Дисперсію вимірюваної ознаки розкладають на незалежні доданки, кожен з яких характеризує вплив того чи іншого фактора їхньої взаємодії. Наступне порівняння таких доданків дозволяє оцінити значимість кожного досліджуваного фактора.

У залежності від кількості факторів, що визначають варіацію результативної ознаки, дисперсійний аналіз поділяють на:

однофакторний;

багатофакторний.

Виробництво елементів РЕА - це досить складний процес. Кожний технологічний етап або технологічна операція характеризується впливом великого числа неконтрольованих факторів: зміною властивостей вихідного матеріалу, вологості середовища, чистоти поверхні пластини і т.д., які носять випадковий характер. Внаслідок цього вихідні параметри приладу, що виготовляється, як на окремій технологічній операції, так і наприкінці циклу виготовлення мають розкид, тобто є випадковими величинами. Така ситуація спостерігається в будь-якому виробництві, проте при виготовленні елементів РЕА не виключено суттєвий розкид параметрів, якими не можна зневажити (наприклад, при виробництві інтегральних схем). Одним з основних критеріїв якості цього виробництва є відсоток виходу придатних схем, що через вплив неконтрольованих факторів залишається дуже низьким. Для врахування розкиду параметрів при аналізі виробництва РЕА використовуються статистичні методи.

Для оцінки і підвищення точності (відповідності реальних розкидів параметрів РЕА заданим обмеженням на їх значення) технологічного процесу виготовлення елементів РЕА необхідно знати її компоненти. Найбільш зручною оцінкою точності є дисперсія як міра розкиду параметрів елементів РЕА, що виготовляються. Завдання полягає в тому, щоб знайти, із яких компонентів вона складається. Це можна зробити за допомогою методів дисперсійного аналізу, що дозволяють розкласти загальну дисперсію на складові, що характеризують відповідну причину (фактор) мінливості параметра РЕА. Прикладом використання такого розкладання дисперсії служить аналіз виробництва інтегральних схем або напівпровідникових приладів. На підставі аналізу можна вибрати умови проведення технологічної операції так, щоб відповідна компонента дисперсії була б мінімальною, тобто з'являється можливість керування точністю технологічного процесу на підставі проведеного експерименту.

Значимість впливу факторів і їх взаємодій на досліджуваний параметр встановлюється почерговим порівнянням їх дисперсій із дисперсією помилки досліду по F - критерію Фішера. Якщо при такому порівнянні дисперсій виявиться, що розрахункове значення F-критерію для якого-небудь фактору більше його табличного значення, обраного при заданому рівні значимості  (звичайно  дорівнює 0,05 або 0,01) і числах ступенів свободи  і , що відповідають порівнюваним дисперсіям, вплив такого фактору або взаємодії вважається суттєвим (значимим) і враховується при наступному вивченні процесу. Дисперсійний аналіз припускає використання якісних факторів (тобто таких, яким не можна поставити у відповідність числову шкалу і які приймають дискретні значення) так само, як у завданні на курсову роботу для аналізу впливу дня тижня (5 дискретних значень некількісного характеру), тижня місяця, марки кремнію.

В залежності від числа джерел мінливості дисперсії (число факторів) дисперсійний аналіз ділять на однофакторний і багатофакторний. Використання ЕОМ для проведення дисперсійного аналізу значно підвищує його ефективність, особливо при проведенні багатофакторного аналізу.

Для аналізу впливу одного фактору (однофакторний аналіз) модель дисперсійного аналізу має вид:

 

, (2.1)

 

де - i-е спостереження над функцією у (параметром технологічної операції), коли фактор x прийняв j-е значення (знаходиться на j-м рівні); - загальне середнє значення у по всіх рівнях фактору x і всіх експериментах;  - ефект впливу j-го рівня фактору x на у; - випадкова помилка в i-му спостереженні на j-му рівні фактора, ,

пj- число спостережень на j-му рівні фактора x; k - число рівнів фактора.

Основні припущення дисперсійногоаналізу такі:

    випадкові величини  незалежні і нормально розподілені з параметрами  (дисперсії однорідні);

- фактор х приймає дискретні досліджуємі значення і

.

Перше припущення фактично накладає вимогу однорідності дисперсії спостерігаємих випадкових величин уij. Тому перед тим, як виконувати дисперсійний аналіз, необхідно переконатися в однорідності дисперсій результатів спостережень на кожному рівні фактору за критерієм Кохрана або Бартлетта. Якщо розбіжність дисперсій виявиться значимою (тобто їх різниця не може бути пояснена випадковими причинами), результати дисперсійного аналізу будуть спотворені. Тому в випадку значимої розбіжності дисперсій необхідно приймати заходи до стабілізації дисперсії або відмовлятися від дисперсійного аналізу.

Критерій Кохрана полягає в порівнянні значення:

 

, (2.2)

 

Він має табульований розподіл із табличним значенням .

Тут - рівень значимості (звичайно приймається рівним 0,1; 0,05; 0.01 і т.д.); k - число порівнюваних дисперсій, f - число ступенів свободи дисперсії

 

 (2.3)

 

- максимальна з дисперсій.

 


 - оцінка дисперсії на j-му рівні;

- оцінка математичного очікування на j-му рівні;.

 

- кількість спостережень на j-му рівні.

Якщо  розбіжність дисперсій значна з можливістю правильного розв'язання , інакше - дисперсії однорідні.

З моделі (2.2) можна одержати відоме основне рівняння дисперсійного аналізу:

 

 (2.4)

або

, (2.5)

 

де  - оцінка  (загальне середнє по всіх спостереженнях);

- оцінка Tj (середнє величини для j-го рівня фактора x).

 

Цей вираз показує розкладання загальної дисперсії (суми квадратів відхилень від загального середнього) на складову, обумовленою впливом фактора (сума квадратів відхилень середніхдля j-го рівня фактору від загального середнього), і складову через випадкові помилки (сума квадратів відхилень  від середнього для j-го рівня фактору). Розділивши суми квадратів відхилень цієї рівності на відповідні їм числа ступенів свободи, можна знайти оцінки дисперсій (загальної, обумовленої впливом фактора й обумовленої випадковими помилками), необхідні для однофакторного дисперсійного аналізу. Число ступенів свободи дисперсії дорівнює різниці між числом незалежних спостережень вибірки і числом зв'язків, накладених на ці незалежні вибірки. Для загальної дисперсії:

 

; (2.6)

 

для факторної:

 

; (2.7)

 

для дисперсії випадкових помилок (залишкова дисперсія):

 

.

 

Таким чином, дисперсійний аналіз виявляє розходження середніх значень , обумовлене впливом фактору х (при цьому дисперсії всіх незалежних випадкових величин , розподілених по нормальному законі, повинні бути однорідні).

Томудляоднофакторного аналізу необхідно перевіряти дві гіпотези щодо поведінки величин:

нульову Н0: Тj = 0для всіх j (тобто фактор х не впливає значимона результат експерименту), модель (4) має вигляд:

 

; (2.8)


- першу   для всіх або для частини j (тобто фактор j значно впливає на результат досліду), модель (2.2) зберігає свій вигляд. Мірою прийняття нульової гіпотези є відношення факторної і залишкової дисперсій, названу дисперсійним відношенням:

 

. (2.9)

 

Випадкова величина F має розподіл, отриманий Р.Фішером. Нульова гіпотеза приймається, якщо , де - рівень значимості прийняття рішення (є імовірністю помилкового розв'язання, тобто прийняття першої гіпотези, коли вірна нульова), тобто з ймовірністю стверджується, що при  вірна нульова гіпотеза; ,  - число ступенів свободи при визначенні табличного значення критерія Фішера (к - число рівнів, nj - число вимірів на j - му рівні).

Перша гіпотеза в противному випадку приймається з таким же рівнем значимості. Якщо нульова гіпотеза відхиляється, методом попарного порівняння середніх по j- м рівнях можна виявити рівні х, які найбільш впливають на досліджуваний процес. Критерій Стьюдента для порівняння середніхдвох вибірок із математичними очікуваннями m1 і m2 і однаковими дисперсіями  з невідомим точним значенням дисперсії (є лише її оцінка  для кожної вибірки) використовується таким чином:

нульова гіпотеза відхиляється ,тобто розбіжність середніх m1 і m2 значима, якщо

 

, (2.10)

 

де - оцінки середніх порівнюваних вибірок обсягом n 1 і n 2 відповідно;

 

 - загальна дисперсія обох вибірок;

 

 - рівень значимості прийняття рішення (ймовірність відкинути нульову гіпотезу, коли вона вірна);

 

- число ступенів свободи розподілу величини t1-б.

 

Якщо на кожному j-му рівні фактору x виконується однакове число спостережень q (як у завданні), основні формули дисперсійного аналізу скорочуються.

Дисперсія спостережень на j-му рівнідля критерію Кохрана

 

. (2.11)

 

Середнє спостереження на j-му рівні фактора:

 

. (2.12)

 

Середнє по всіх спостереженнях:

 

. (2.13)

 

Факторна дисперсія:

 

. (2.14)

 

Залишкова дисперсія:

 

. (2.15)

 

Загальна дисперсія:

 

. (2.16)

 

Критерій Стьюдента:

 

, де . (2.17)

 

Дослідження значимості впливу зазначеного в завданні фактору на показник технологічної операції методом дисперсійного аналізу рекомендується виконувати в такій послідовності:

Усвідомити зміст розв'язуваного завдання: фактор, показник технологічної операції, число рівнів фактору, число спостережень на кожному рівні фактору.

. Перевірити по критерію Кохрана однорідність дисперсій спостережень на різних рівнях фактору.

3. Скласти дисперсійне відношення і порівняти з табличним  при заданому рівні значимості .

. За критерієм Стьюдента виконати попарне порівняння середніх всіх рівнів фактора з метою виявлення найбільш впливаючих рівнів.

. Зробити висновок про ступінь налагодження технологічного процесу і вжити заходи щодо усунення відхилень від нормального функціонування. Нормально функціонуючий технологічний процес не повинен залежати від впливу розглянутих факторів.

. Вжити заходи до стабілізації дисперсії (вирівнюють точність вимірів для різних рівнів, знижують суб'єктивні помилки, виключають з результатів досвіди з  і т.д. і переходять до перевірки по критерію Кохрана. Якщо не вдається досягти однорідності дисперсії, метод дисперсійного аналізу застосовувати не можна.

. Кінець досліджень.

Завдяки автоматизації дисперсійного аналізу дослідник може проводити різні статистичні дослідження з застосування ЕОМ, затрачаючи при цьому менше часу і зусиль на розрахунки даних.

Дисперсійний аналіз є сучасним статистичним методом обробки й аналізу експериментальних даних у економіці, біології, техніці й інших науках. Він дуже тісно зв'язаний з конкретною методологією планування і проведення експериментальних досліджень.






Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: