2.1 Теоретические сведения
2.1.1 Сравнение двух дисперсий. Цель сравнения дисперсий двух выборок и – ответ на вопрос, является ли различие выборочных дисперсий и случайным, в то время как истинные дисперсии (т.е. дисперсии генеральных совокупностей) совпадают: , или действительно . Формально проверяется гипотеза о равенстве истинных дисперсий: . Если генеральные совокупности распределены нормально, критерием является отношение:
Отношение ( критерий) – случайная переменная, подчиняющаяся распределению Фишера, представленного на рисунке 7, с степенями свободы дисперсии в числителе и степенями свободы в знаменателе. Область значений критерия . Так как по смыслу задачи обе равноправны, то альтернативной проверяемой гипотезе является гипотеза . критерий может принимать любые значения из интервала и является двусторонним – имеет две критические области. Но, всегда помещая в числитель отношения большую из двух дисперсий (т.е. считая ), мы ограничиваем практическое применение критерия интервалом с единственной (правой) критической областью:
|
|
где – уровень значимости критерия.
Рисунок 7 – Распределение Фишера (заштрихована правая критическая область F - критерия, левая критическая не показана)
Очевидно, что чем больше отношение, тем меньше вероятность того, что дисперсии генеральных совокупностей и совпадают. Если вычисленное значение превосходит критическое (табличное) значение двустороннего критерия Фишера , то с риском ошибки не большим, чем утверждается, что дисперсии генеральных совокупностей различны.
Иначе это формулируется: дисперсии различаются значимо. Если знак неравенства противоположный, говорят, что дисперсии различаются незначимо.
2.1.2 Сравнение двух средних. Сравнение средних и двух выборок и , как и сравнение дисперсий, отвечает на вопрос, различаются ли средние и статистически значимо и тогда математические ожидания генеральных совокупностей различны: или различие выборочных средних случайно и . Таким образом, проверяется гипотеза о равенстве математических ожиданий против альтернативной гипотезы об их неравенстве. При условии, что дисперсии различаются незначимо (т.е. гипотеза не противоречит наблюдениям) критерием здесь является функция:
где свободная дисперсия
Критерий имеет t – распределение Стьюдента с степенями свободы. Критерий двусторонний с двумя критическими областями (рисунок 4). Но, поскольку - распределение симметрично относительно нуля, на практике после замены на можно использовать только правую половину t – распределения, для которой и составляются таблицы. Если вычисленное значение t – критерия превосходит критическое (табличное) с уровнем значимости a и числом степеней свободы n , то гипотеза о равенстве математических ожиданий отклоняется с риском ошибки не большим, чем a. Иначе говорят, что средние и различаются значимо. Если знак неравенства противоположный, гипотеза о равенстве математических ожиданий не отклоняется, и различие средних и незначимо.
|
|
2.1.3 Несколько групп данных. Часто необходимо сравнить групп данных с различным числом наблюдений в группах. Обозначим число наблюдений в – той группе – , а общее число наблюдений : . Считаем, что данные в – той группе – независимая выборка из своей ( – той) нормально распределённой генеральной совокупности с математическим ожиданием и истиной дисперсией .
Выборочное среднее в группе:
Выборочная дисперсия:
Число степеней свободы
Сравнение нескольких дисперсий (проверка гипотезы однородности дисперсий)
Сравнение дисперсий предполагает проверку гипотезы о том, что истинные дисперсии соответствующих нормальных генеральных совокупностей равны: - не равна всем остальным.
Проверочная статистика этой гипотезы (критерий Бартлетта) – отношение:
Числитель которого
Где , а знаменатель
Если все , критерий Бартлетта приближенно подчиняется c2 – распределению (распределению Пирсона) с степенями свободы. Если величина критерия B больше критического значения B > , то гипотеза однородности дисперсий отвергается с риском ошибки, не большим . Если знак неравенства противоположный, гипотеза однородности дисперсий не противоречит наблюдениям и не отвергается.
2.1.4 Сравнение нескольких средних (дисперсионный анализ). Оценка различий между средними в нескольких группах проводится методом дисперсионного анализа. В нем сравнивается разброс данных между группами с разбросом данных внутри групп.
При условии однородности дисперсий все дисперсии в группах оценивают одну и ту же внутригрупповую дисперсию . Тогда все выборочные дисперсии можно объединить, получив средний квадрат отклонений в группе (иначе – остаточную дисперсию) с числом степеней свободы
Остаточная дисперсия – обобщенная оценка истинной внутригрупповой дисперсии , характеризующей разброс наблюдений внутри групп.
При равенстве дисперсий различие между группами проявляется в разнице математических ожиданий в группах . Если все математические ожидания равны: , то различия между группами нет. В этом случае все группы являются выборками из одной и той же (нормальной) генеральной совокупности с математическим ожиданием и дисперсией .
Различие между группами оценивается по разбросу средних в группах вокруг общего среднего :
Поскольку дисперсия выборочного среднего по наблюдениям в раз меньше дисперсии генеральной совокупности, то в оценке дисперсии между группами через выборочные средние каждое слагаемое берется со своим множителем :
Величина называется средним квадратом между группами или межгрупповой дисперсией; она характеризует разброс данных между группами. Число ее степеней свободы . Если гипотеза , верна, то разброс между группами наблюдений только случайный, дисперсия генеральной совокупности совпадает с внутригрупповой дисперсией и оба средних квадрата и оценивают эту дисперсию. Если же реальное различие между группами существует (т.е. гипотеза , не верна), то остаточная дисперсия оценивает только дисперсию в группах, истинное значение которой, как и ранее равно , а межгрупповая дисперсия оценивает истинную межгрупповую дисперсию, значение которой больше, чем . Поскольку принята гипотеза нормального распределения в группах, оценку различия дисперсий и можно провести количественно, рассчитав - критерий – отношение:
|
|
Критерий односторонний – альтернативная гипотеза (различия математических ожиданий в группах ) предполагает, что дисперсия в числителе отношения больше дисперсии в знаменателе. Следовательно, если рассчитанное значение критерия превосходит критическое значение одностороннего критерия Фишера с уровнем значимости a и с числом степеней свободы дисперсии в числителе дисперсии в знаменателе то гипотеза равенства математических ожиданий в группах , противоречит наблюдениям с риском ошибки этого утверждения не больше, чем a. Иначе говоря, если дисперсия между группами значимо больше остаточной дисперсии, то средние в группах различаются значимо, т.е. изменение свойства Х между группами заметно на фоне его разброса внутри групп. При противоположном знаке неравенства гипотеза о равенстве математических ожиданий в группах , не противоречит наблюдениям или средние в группах различаются незначимо.
2.2 Практическая часть
Задание:
1) Имеются четыре группы данных .
2) Рассчитать в группах выборочные средние и выборочные дисперсии
3) Для выборочных дисперсий и рассчитать значение F-критерия и, сравнив его с табличным значением с уровнем значимости a = 0,05, проверить гипотезу о значимом различии дисперсий.
4) Для выборочных средних и рассчитать значение t-критерия и, сравнив его с табличным значением с уровнем значимости a = 0,05, проверить гипотезу о значимом различии средних.
5) Для выборочных дисперсий в группах рассчитать значение критерия Бартлетта В, и сравнив его с табличным значением критерия s2 с уровнем значимости a = 0,05, проверить гипотезу однородности дисперсий.
6) Провести дисперсионный анализ: рассчитать отношение дисперсии между группами к остаточной дисперсии, сравнить его со значением F-критерия с уровнем значимости a = 0,05 проверить гипотезу о значимом различии средних в группах.
|
|
7) Рассчитать доверительные интервалы истинных средних в группах с доверительной вероятностью 0,95. Построить диаграмму средних в группах с доверительными интервалами. Описать особенности диаграммы, если они есть.
Исходные данные представлены в таблице 2.
Таблица 2 – Исходные данные
Высота по оси слитка | 1 | 2 | 3 | 4 |
Плотность сульфидов мм-2 в стали 40Х | 12,1 | 16,2 | 22,2 | 30,7 |
15,5 | 7,6 | 12 | 12,1 | |
10,9 | 11,4 | 19,5 | 22,7 | |
21,9 | 18,1 | 20,5 | 18,7 | |
20,6 | 10,4 | 14,9 | 19,4 | |
11,3 | 11,4 | 11,8 | 9,1 | |
14,8 | 19,1 | 13,6 | 32,4 | |
12,7 | 2,0 | 22,2 | 11,1 | |
12,2 | 13,0 | 25,6 | 20,6 | |
17,1 | 9,0 | 20,4 | ||
13,3 |
1) Расчет выборочных средних и дисперсий
Число групп данных . Рассчитывается число данных в каждой группе и число степеней свободы дисперсии в группах
Вычисляется сумма и сумма квадратов для каждой группы:
Рассчитывается выборочные средние и выборочные дисперсии в группах
Рассчитанные значения представлены в таблице 3.
2) Проверка гипотезы о значимом различии дисперсий
Рассчитывается отношение дисперсий по формуле:
По данным представленным в приложении Г, определяется табличное значение – критерия с уровнем значимости
Проводится сравнение рассчитанного – критерия с табличным с применением двустороннего критерия Фишера (неравенство (17)).
Вывод: с риском ошибки не большим дисперсии и различаются незначимо.
3) Проверка гипотезы о значимом различии средних
Для дисперсий и рассчитывается объединенная дисперсия по формуле (19) и число ее степеней свободы
Рассчитывается по формуле (18) значение t – критерия
По данным представленным в приложении Б, определяется табличное значение критерия с уровнем значимости
Проводится сравнение рассчитанного – критерия с табличным значением
Вывод: гипотеза о равенстве математических ожиданий отклоняется с риском ошибки небольшим 0,05 и средние и различаются значимо.
4) Проверка гипотезы однородности дисперсий
Предварительные вычисления проводятся по формулам: ; ; .
Вычисляются суммы :
Рассчитывается общее число степеней свободы
Рассчитывается числитель и знаменатель критерия Бартлетта по формулам:
Критерий Бартлетта вычисляется по формуле (22).
По данным, представленным в приложении В, определяется табличное значение критерия Пирсона с уровнем значимости 0,05 и числом степеней свободы .
Проводится сравнение рассчитанного значения с табличным значением критерия Пирсона .
Вывод: гипотеза однородности дисперсий не отвергается и не противоречит наблюдениям.
Результаты расчетов представлены в таблице 3.
5) Дисперсионный анализ
Рассчитывается общее число данных и общее среднее
Рассчитывается остаточная дисперсия как взвешенная сумма дисперсий в группах
Рассчитывается квадраты отклонения групп от общего среднего
Рассчитанные значения , представлены в таблице 3.
Рассчитывается дисперсия между группами
Вычисляется отношение дисперсий по формуле (29).
По данным, представленным в приложении Г, определяется табличное значение критерия Фишера с уровнем значимости и числом степеней свободы , дисперсии в знаменатели .
Проводится сравнение рассчитанного критерия Фишера с табличным значением критерия Фишера
Вывод: гипотеза равенства математических ожиданий в группах не противоречит наблюдениям с риском ошибки утверждения не больше чем 0,05, то есть изменение свойства между группами различаются незначимо.
6) Построение диаграммы средних в группах с доверительными интервалами
В каждой группе рассчитывается полуширина доверительного интервала с доверительной вероятностью Р = 0,95
Значение с уровнем значимости и числом степеней свободы 36 определяется по таблице представленной в приложение Б.
Рассчитывается нижние и верхние доверительные границы средних в группах
Рассчитанные значения представлены в таблице 3.
Таблица 3 – Результаты расчетов
Группа | 1 | 2 | 3 | 4 |
Данных в группе | 10 | 11 | 10 | 9 |
Число степеней свободы | 9 | 10 | 9 | 8 |
Сумма | 149,1 | 131,5 | 182,7 | 176,8 |
Сумма квадратов | 2358,710 | 1811,590 | 3547,910 | 4010,380 |
Средние | 14,910 | 11,955 | 18,270 | 19,644 |
Дисперсия | 15,070 | 23,957 | 23,331 | 67,155 |
ln | 2,713 | 3,176 | 3,150 | 4,207 |
135,629 | 239,567 | 209,981 | 537,242 | |
24,414 | 31,762 | 28,348 | 33,656 | |
0,111 | 0,100 | 0,111 | 0,125 | |
S1 | 1122,419 |
|
|
|
S2 | 118,181 |
|
|
|
S3 | 0,447 |
|
|
|
Квадрат отклонения групп | 11,936 | 180,245 | 51,416 | 119,374 |
Полуширина доверительного интервала | 2,481 | 2,983 | 3,087 | 5,521 |
Нижняя доверительная граница | 12,429 | 8,972 | 15,183 | 14,124 |
Верхняя доверительная граница | 17,391 | 14,937 | 21,357 | 25,165 |
Строится диаграмма изменчивости средних в группах, представленная на рисунке 8, с нанесениям средних с 95% - ными доверительными границами.
Рисунок 8 - Средние в группах с 95% доверительными интервалами для математических ожиданий