Сравнение средних и дисперсий

 

2.1 Теоретические сведения

 

2.1.1 Сравнение двух дисперсий. Цель сравнения дисперсий двух выборок  и  – ответ на вопрос, является ли различие выборочных дисперсий  и  случайным, в то время как истинные дисперсии (т.е. дисперсии генеральных совокупностей) совпадают: , или действительно . Формально проверяется гипотеза о равенстве истинных дисперсий: . Если генеральные совокупности распределены нормально, критерием является отношение:

 

Отношение  (  критерий) – случайная переменная, подчиняющаяся распределению Фишера, представленного на рисунке 7, с  степенями свободы дисперсии в числителе и  степенями свободы в знаменателе. Область значений  критерия . Так как по смыслу задачи обе равноправны, то альтернативной проверяемой гипотезе является гипотеза .  критерий может принимать любые значения из интервала  и является двусторонним – имеет две критические области. Но, всегда помещая в числитель отношения большую из двух дисперсий (т.е. считая ), мы ограничиваем практическое применение критерия интервалом  с единственной (правой) критической областью:

 

где  – уровень значимости  критерия.

 

Рисунок 7 – Распределение Фишера (заштрихована правая критическая область F - критерия, левая критическая не показана)

 

Очевидно, что чем больше отношение, тем меньше вероятность того, что дисперсии генеральных совокупностей  и совпадают. Если вычисленное значение  превосходит критическое (табличное) значение двустороннего критерия Фишера , то с риском ошибки не большим, чем  утверждается, что дисперсии генеральных совокупностей  различны.

Иначе это формулируется: дисперсии  различаются значимо. Если знак неравенства противоположный, говорят, что дисперсии  различаются незначимо.

2.1.2 Сравнение двух средних. Сравнение средних  и  двух выборок  и , как и сравнение дисперсий, отвечает на вопрос, различаются ли средние   и  статистически значимо и тогда математические ожидания генеральных совокупностей различны:  или различие выборочных средних случайно и . Таким образом, проверяется гипотеза о равенстве математических ожиданий против альтернативной гипотезы об их неравенстве. При условии, что дисперсии  различаются незначимо (т.е. гипотеза  не противоречит наблюдениям) критерием здесь является функция:

 

 

где свободная дисперсия

 

 

Критерий имеет t – распределение Стьюдента с  степенями свободы. Критерий двусторонний с двумя критическими областями  (рисунок 4). Но, поскольку - распределение симметрично относительно нуля, на практике после замены  на  можно использовать только правую половину t – распределения, для которой и составляются таблицы. Если вычисленное значение t – критерия превосходит критическое (табличное) с уровнем значимости a и числом степеней свободы n , то гипотеза о равенстве математических ожиданий  отклоняется с риском ошибки не большим, чем a. Иначе говорят, что средние  и  различаются значимо. Если знак неравенства противоположный, гипотеза о равенстве математических ожиданий не отклоняется, и различие средних  и  незначимо.

2.1.3 Несколько групп данных. Часто необходимо сравнить  групп данных с различным числом наблюдений в группах. Обозначим число наблюдений в  – той  группе – , а общее число наблюдений : . Считаем, что данные в  – той группе  – независимая выборка из своей (  – той) нормально распределённой генеральной совокупности с математическим ожиданием  и истиной дисперсией .

Выборочное среднее в группе:

 

 

Выборочная дисперсия:

 

 

Число степеней свободы

 

Сравнение нескольких дисперсий (проверка гипотезы однородности дисперсий)

Сравнение дисперсий  предполагает проверку гипотезы о том, что истинные дисперсии соответствующих нормальных генеральных совокупностей равны:  -  не равна всем остальным.

Проверочная статистика этой гипотезы (критерий Бартлетта) – отношение:

 

 

Числитель которого

 

 

Где  , а знаменатель

 

 

Если все , критерий Бартлетта приближенно подчиняется c2 – распределению (распределению Пирсона) с  степенями свободы. Если величина критерия B больше критического значения B > , то гипотеза однородности дисперсий отвергается с риском ошибки, не большим . Если знак неравенства противоположный, гипотеза однородности дисперсий не противоречит наблюдениям и не отвергается.

2.1.4 Сравнение нескольких средних (дисперсионный анализ). Оценка различий между средними в нескольких группах проводится методом дисперсионного анализа. В нем сравнивается разброс данных между группами с разбросом данных внутри групп.

При условии однородности дисперсий все дисперсии в группах  оценивают одну и ту же внутригрупповую дисперсию  . Тогда все выборочные дисперсии  можно объединить, получив средний квадрат отклонений в группе (иначе – остаточную дисперсию) с числом степеней свободы

 

Остаточная дисперсия  – обобщенная оценка истинной внутригрупповой дисперсии , характеризующей разброс наблюдений внутри групп.

При равенстве дисперсий различие между группами проявляется в разнице математических ожиданий в группах  . Если все математические ожидания равны: , то различия между группами нет. В этом случае все группы являются выборками из одной и той же (нормальной) генеральной совокупности с математическим ожиданием  и дисперсией .

Различие между группами оценивается по разбросу средних в группах  вокруг общего среднего :

 

Поскольку дисперсия выборочного среднего по  наблюдениям в  раз меньше дисперсии генеральной совокупности, то в оценке дисперсии между группами через выборочные средние  каждое слагаемое берется со своим множителем :

 

 

Величина  называется средним квадратом между группами или межгрупповой дисперсией; она характеризует разброс данных между группами. Число ее степеней свободы  . Если гипотеза , верна, то разброс между группами наблюдений только случайный, дисперсия генеральной совокупности совпадает с внутригрупповой дисперсией  и оба средних квадрата  и оценивают эту дисперсию. Если же реальное различие между группами существует (т.е. гипотеза , не верна), то остаточная дисперсия  оценивает только дисперсию в группах, истинное значение которой, как и ранее равно , а межгрупповая дисперсия  оценивает истинную межгрупповую дисперсию, значение которой больше, чем . Поскольку принята гипотеза нормального распределения в группах, оценку различия дисперсий и   можно провести количественно, рассчитав - критерий – отношение:

 

Критерий односторонний – альтернативная гипотеза (различия математических ожиданий в группах ) предполагает, что дисперсия в числителе отношения больше дисперсии в знаменателе. Следовательно, если рассчитанное значение критерия превосходит критическое значение одностороннего критерия Фишера с уровнем значимости a и с числом степеней свободы дисперсии в числителе дисперсии в знаменателе  то гипотеза равенства математических ожиданий в группах , противоречит наблюдениям с риском ошибки этого утверждения не больше, чем a. Иначе говоря, если дисперсия между группами значимо больше остаточной дисперсии, то средние в группах различаются значимо, т.е. изменение свойства Х между группами заметно на фоне его разброса внутри групп. При противоположном знаке неравенства гипотеза о равенстве математических ожиданий в группах ,  не противоречит наблюдениям или средние в группах различаются незначимо.

 

2.2 Практическая часть

 

Задание:

1) Имеются четыре группы данных .

2) Рассчитать в группах выборочные средние и выборочные дисперсии

3) Для выборочных дисперсий  и  рассчитать значение F-критерия и, сравнив его с табличным значением с уровнем значимости a = 0,05, проверить гипотезу о значимом различии дисперсий.

4) Для выборочных средних и  рассчитать значение t-критерия и, сравнив его с табличным значением с уровнем значимости a = 0,05, проверить гипотезу о значимом различии средних.

5) Для выборочных дисперсий в группах  рассчитать значение критерия Бартлетта В, и сравнив его с табличным значением критерия s2 с уровнем значимости a = 0,05, проверить гипотезу однородности дисперсий.

6) Провести дисперсионный анализ: рассчитать отношение дисперсии между группами к остаточной дисперсии, сравнить его со значением F-критерия с уровнем значимости a = 0,05 проверить гипотезу о значимом различии средних в группах.

7) Рассчитать доверительные интервалы истинных средних в группах с доверительной вероятностью 0,95. Построить диаграмму средних в группах с доверительными интервалами. Описать особенности диаграммы, если они есть.

 

Исходные данные представлены в таблице 2.

 

Таблица 2 – Исходные данные

Высота по оси слитка 1

2

3

4

Плотность сульфидов мм-2 в стали 40Х

12,1

16,2

22,2

30,7

15,5

7,6

12

12,1

10,9

11,4

19,5

22,7

21,9

18,1

20,5

18,7

20,6

10,4

14,9

19,4

11,3

11,4

11,8

9,1

14,8

19,1

13,6

32,4

12,7

2,0

22,2

11,1

12,2

13,0

25,6

20,6

17,1

9,0

20,4

 

13,3

 

1) Расчет выборочных средних и дисперсий

Число групп данных . Рассчитывается число данных в каждой группе  и число степеней свободы дисперсии в группах

 

 

Вычисляется сумма и сумма квадратов для каждой группы:

 

 

Рассчитывается выборочные средние  и выборочные дисперсии  в группах

 

 

Рассчитанные значения представлены в таблице 3.

2) Проверка гипотезы о значимом различии дисперсий

Рассчитывается отношение дисперсий по формуле:

 

 

 

По данным представленным в приложении Г, определяется табличное значение  – критерия с уровнем значимости

 

 

Проводится сравнение рассчитанного  – критерия с табличным с применением двустороннего критерия Фишера (неравенство (17)).

 

 

Вывод: с риском ошибки не большим  дисперсии  и  различаются незначимо.

3) Проверка гипотезы о значимом различии средних

Для дисперсий  и  рассчитывается объединенная дисперсия  по формуле (19) и число ее степеней свободы

 

 

 

Рассчитывается по формуле (18) значение t – критерия

 

 

По данным представленным в приложении Б, определяется табличное значение  критерия с уровнем значимости

 

 

Проводится сравнение рассчитанного  – критерия с табличным значением

 

 

Вывод: гипотеза о равенстве математических ожиданий отклоняется с риском ошибки небольшим 0,05 и средние  и  различаются значимо.

4) Проверка гипотезы однородности дисперсий

Предварительные вычисления проводятся по формулам: ; ; .

Вычисляются суммы :

 

Рассчитывается общее число степеней свободы

 

 

 

Рассчитывается числитель  и знаменатель  критерия Бартлетта  по формулам:

 

Критерий Бартлетта вычисляется по формуле (22).

 

 

По данным, представленным в приложении В, определяется табличное значение критерия Пирсона с уровнем значимости 0,05 и числом степеней свободы .

 

 

Проводится сравнение рассчитанного значения  с табличным значением критерия Пирсона .

 

 

Вывод: гипотеза однородности дисперсий не отвергается и не противоречит наблюдениям.

Результаты расчетов представлены в таблице 3.

5) Дисперсионный анализ

Рассчитывается общее число данных  и общее среднее

 

 

Рассчитывается остаточная дисперсия  как взвешенная сумма дисперсий в группах

 

 

 

Рассчитывается квадраты отклонения групп от общего среднего

 

 

Рассчитанные значения , представлены в таблице 3.

Рассчитывается дисперсия между группами

 

 

 

Вычисляется отношение дисперсий по формуле (29).

 

 

По данным, представленным в приложении Г, определяется табличное значение критерия Фишера с уровнем значимости  и числом степеней свободы , дисперсии в знаменатели .

 

 

Проводится сравнение рассчитанного критерия Фишера  с табличным значением критерия Фишера

 

 

Вывод: гипотеза равенства математических ожиданий в группах не противоречит наблюдениям с риском ошибки утверждения не больше чем 0,05, то есть изменение свойства между группами различаются незначимо.

6) Построение диаграммы средних в группах с доверительными интервалами

В каждой группе рассчитывается полуширина доверительного интервала с доверительной вероятностью Р = 0,95

 

 

Значение  с уровнем значимости и числом степеней свободы 36 определяется по таблице представленной в приложение Б.

 

 

Рассчитывается нижние и верхние  доверительные границы средних в группах

 

 

Рассчитанные значения представлены в таблице 3.

 

Таблица 3 – Результаты расчетов

Группа

1

2

3

4

Данных в группе

10

11

10

9

Число степеней свободы

9

10

9

8

Сумма

149,1

131,5

182,7

176,8

Сумма квадратов

2358,710

1811,590

3547,910

4010,380

Средние

14,910

11,955

18,270

19,644

Дисперсия

15,070

23,957

23,331

67,155

ln

2,713

3,176

3,150

4,207

135,629

239,567

209,981

537,242

24,414

31,762

28,348

33,656

0,111

0,100

0,111

0,125

S1

1122,419

 

 

 

S2

118,181

 

 

 

S3

0,447

 

 

 

Квадрат отклонения групп

11,936

180,245

51,416

119,374

Полуширина доверительного интервала

2,481

2,983

3,087

5,521

Нижняя доверительная граница

12,429

8,972

15,183

14,124

Верхняя доверительная граница

17,391

14,937

21,357

25,165

 

Строится диаграмма изменчивости средних в группах, представленная на рисунке 8, с нанесениям средних с 95% - ными доверительными границами.

 

Рисунок 8 - Средние в группах с 95% доверительными интервалами для математических ожиданий

 


 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: