Дневная выработка ткачих, м

Следовательно, 93,1% всей вариации объясняется тем, что часть ткачих работала на 32 станках, а часть – на 48 и только 6,9% вариации является результатом действия прочих случайных факторов, не положенных в основание группировки.

Дисперсионный анализ позволяет не только определить роль случайной и систематической вариации, но и оценить достоверность вариации, обнаруженной методом аналитических группировок. Определение достоверности вариации дает возможность с заданной степенью вероятности установить, чем вызвана межгрупповая вариация – признаком, положенным в основание группировки, или является результатом действия случайных причин. Для оценки существенности корреляционного отношения пользуются критическими значениями корреляционного отношения η при разных уровнях вероятности или значимости а. Уровень значимости – это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться практически невозможными. Появление такого события является указанием на неправильность начального предположения. Чаще всего пользуются уровнями а = 0,05 или а = 0,01. Критические значения корреляционного отношения содержатся в специальных таблицах (см. приложение 4).

В этих таблицах распределение η 2 при случайных выборках зависит от числа степеней свободы факторной и случайной дисперсий.

Число степеней свободы факторной дисперсии К1 = т - 1, где т – число групп, а для случайной дисперсии К2 = n - т, где n – число вариант, m – число групп. В нашем примере 10 ткачих сгруппированы в две группы по числу обслуживаемых станков. Поэтому R1 = т - 1 = 2 -1 = 1 ,a R2= n - m = 10 - 2 = 8. По таблице приложения 4 находим критическое значение η2, соответствующее R 1 = 1 и R2 = 8 для уровней значимости a = 0,05, которое равно: η 2(0,05) = 0,399. Это значит, что только в пяти случаях из 100 может случайно возникнуть корреляционное отношение, превышающее 0,399, а в 95 случаях из 100 корреляционное отношение не может быть больше 0,399. Теперь фактическое значение корреляционного отношения надо сравнить с критическим, табличным. Если оно окажется больше критического, то связь между результативным и факторным признаками считается существенной, если же фактическое значение корреляционного п2 меньше табличного, то связь между указанными признаками считается несущественной. В рассматриваемом нами примере фактическое значение корреляционного отношения η 2 = 0,93 больше табличного η 2(0,05) = 0,399. Поэтому связь между числом обслуживаемых станков и выработкой является существенной.

При проверке существенной связи чаще пользуются критерием Фишера, потому что при больших числах степеней свободы его табличные значения мало изменяются, в отличие от корреляционного отношения, которое требует более громоздких таблиц. Критерий Фишера представляет собой отношение межгрупповой дисперсии к средней из среднегрупповых дисперсий, исчисленных с учетом числа степеней свободы:

Для этих отношений Фишер (отсюда название "критерий Фишера") составил таблицы, по которым можно определить, какая величина F при данном числе степеней свободы по факторной вариации (R 1 ) и остаточной вариации (R 2 ) дает основание утверждать с определенной вероятностью (например, 0,95 х 0,399), что положенный в основание группировки признак является несущественным (см. приложение 5).

При уровне значимости а = 0,05, К 1 = 1 и К 2 = 8 критическое табличное значение F = 5,32. Значит, уже при значении F = 5,32 можно с вероятностью 0,95 утверждать, что группировочный признак (число обслуживаемых станков) является весьма существенным. В нашем примере F = 108,1. Тем более есть основания считать, что полученные в результате группировки данные являются вполне достоверными.

Зная корреляционное отношение, можно определить критерий Фишера по следующей формуле:

Мы рассмотрели схему дисперсионного анализа при группировке по одному факторному признаку. Аналогично проводится анализ при комбинационной группировке по двум и более факторам. В этих случаях необходима оценка достоверности влияния не только каждого положенного в основание группировки фактора в отдельности, но и результаты их взаимодействия. Последний определяется как разность между эффектом совместного влияния двух группировочных признаков и суммой эффектов влияния каждого из этих факторных признаков, взятых в отдельности. Это осложняет расчеты суммы квадратов отклонений и числа свободы вариации. Но сам принцип дисперсионного анализа, заключающийся в сопоставлении факторной дисперсии со случайной для оценки достоверности результатов статистической группировки, неизменен при любом числе признаков группировки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: