Однофакторный дисперсионный анализ

Пусть на случайную величину x влияет один фактор, имеющий m -уровней или m -факторов, относящихся к одному источнику изменчивости. На каждом уровне произведено n1, n2, …, nm независимых испытаний. H0: рассматриваемые факторы не оказывают существенного влияния на изменчивость средних значений, то есть групповые средние должны быть равны при допущении, что групповые генеральные дисперсии хотя и неизвестны, но одинаковы. Данные опытов можно представить в виде матрицы, где каждая переменная, xij обозначает значение признака наблюдаемого на i ом уровне при проведении j ого опыта. Модель дисперсионного анализа можно представить в виде xiji+Eij, где βi – среднее значение i ого уровня. Eij – вариация результатов внутри отдельного уровня. В качестве примера можно привести опыт Кенделла в 1951 году, когда он исследовал срок служб электрических ламп (в 1000 часов), который мог зависеть от сорта проволоки. Остальные факторы производства были постоянны. Был поставлен вопрос: отличаются ли партии ламп между собой и если да, то нужно добиваться однородности проволоки во всех партиях. Были выбраны четыре сорта проволоки, то есть m=4, n1=7, n2=5, n3=8, n4=6, то есть на каждом уровне было проведено различное число наблюдений. Данные в опытах можно привести в таблице

№ партии Срок службы электрических ламп, тыс.ч. Σx ni
  1,60 1,61 1,65 1,68 1,70 1,72 1,8   11,76   1,68
  1,58 1,64 1,64 1,70 1,75       8,31   1,66
  1,46 1,55 1,60 1,62 1,64 1,66 1,74 1,82 13,09   1,64
  1,51 1,52 1,53 1,57 1,60 1,68     9,41   1,57
  42,57   1,67 1,67

Анализ таблицы показывает, что наблюдается вариация средних значений от 1,57 до 1,68. Только одно групповое значение совпадает со средним выборки. При этом вариация внутри каждой группы значительна, то есть, обусловлена случайными факторами. Общая сумма квадратов отклонений отдельных наблюдений от общей средней раскладывается на две составляющие: Q=Q1+Q2, где

. Q1 – сумма квадратов отклонений между группами или уравнениями:

. Q2 называется остаточной дисперсией, потому что может быть найдено по формуле Q2=Q-Q1. Для получения оценки каждой дисперсии нужно разделить ее на число степеней свободы, которое для каждой дисперсии находится по своим формулам ν1=m-1.

,. Схему дисперсионного анализа можно привести в таблице, где последний столбец – оценка дисперсий, находится по формулам:

,,.

Так как S12>S22, то можно сформировать f -статистику:

Вариация Σ квадратов Число степеней свободы Оценка дисперсии
Общая 0,1959   0,0078
Между партиями 0,0426   0,0142
Остаточная 0,1533   0,0070

Если Fрасч>Fтабл рассчитанного при ν1 и ν2 и выбранном α, то H0 отвергается. Сорт проволоки влияет на срок службы, тогда анализ продолжается при помощи t -статистики, которая дает оценку расхождения средних значений по каждому уровню. t -статистика формируется для двух выборок:

. Если tрасч<tтабл, то разность между средними несущественна. В опытах Кенделла Fрасч<Fтабл. Вся совокупность электроламп однородна. Эту же гипотезу можно проверить по критерию Романовского:

ν2 должно быть больше 4.

. Если R≥3, то расхождение между оценками дисперсий существенно. В задаче Кенделла R<3, то есть расхождение между средними случайно.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: