Для проверки распределения на предмет соответствия нормальному закону вычисляют выборочную среднюю и среднее квадратическое отклонение σ, а затем вычисляют теоретические частоты по следующей формуле:
где: n – объём выборки, h – шаг (разность между двумя соседними вариантами),
Рассмотрим пример. В результате выборочного обследования стажа работы профессорско-преподавательского состава получены следующие данные:
Стаж работы (лет) | 0-4 | 4-8 | 8-12 | 12-16 | 16-20 | 20-24 | 24-28 | 28-32 |
Число преподавателей |
Выяснить, является ли распределение стажа работы нормальным на уровне значимости α=0,01.
Для решения поставленной задачи перейдем от заданного интервального распределения к распределению равноотстоящих вариант и вычислим выборочную среднюю и выборочное среднее квадратическое отклонение.
n=161,
а
Составим расчетную таблицу, заполняя её последовательно по столбцам слева направо:
i | xi | ni | (ni-ni’)2 | ||||
-2,58 | 0,014 | 1,66 | 1,8 | 1,08 | |||
-1,84 | 0,073 | 8,66 | 0,44 | 0,05 | |||
-1,1 | 0,218 | 25,85 | 0,72 | 0,033 | |||
-0,37 | 0,373 | 44,24 | 17,89 | 0,41 | |||
0,37 | 0,373 | 44,24 | 3,1 | 0,07 | |||
1,1 | 0,218 | 25,85 | 26,52 | 1,03 | |||
1,84 | 0,073 | 8,66 | 7,08 | 0,82 | |||
2,58 | 0,014 | 1,66 | 0,12 | 0,07 | |||
Σ |
По таблице критических точек распределения по уровню значимости α=0,01 и числу степеней свободы k=s-3=8-3=5 находим критическую точку критической области
|
|
Так как то гипотезу о нормальном распределении генеральной совокупности принимаем.
Критерий Манна-Уитни
U-критерий Манна-Уитни используется для оценки различий между двумя малыми выборками (n1,n2≥3 или n1=2, n2≥5) по уровню количественно измеряемого признака. При этом первой выборкой принято считать ту, где значение признака больше.
Нулевая гипотеза H0={уровень признака во второй выборке не ниже уровня признака в первой выборке}; альтернативная гипотеза – H1={уровень признака во второй выборке ниже уровня признака в первой выборке}.
Рассмотрим алгоритм применения U-критерия Манна-Уитни:
1. Перенести все данные испытуемых на индивидуальные карточки, пометив карточки 1-й выборки одним цветом, а 2-й – другим.
2. Разложить все карточки в единый ряд по степени возрастания признака и проранжировать в таком порядке.
3. Вновь разложить карточки по цвету на две группы.
4. Подсчитать сумму рангов отдельно по группам и проверить, совпадает ли общая сумма рангов с расчетной.
5. Определить большую из двух ранговых сумм .
6. Вычислить эмпирическое значение U:
, где - количество испытуемых в - выборке (i = 1, 2), - количество испытуемых в группе с большей суммой рангов.
7. Задать уровень значимости α и, используя специальную таблицу, определить критическое значение Uкр(α). Если , то H 0 на выбранном уровне значимости принимается.
Рассмотрим использование U критерия Манна-Уитни на примере.
Проведение срезовой контрольной работы по математике (алгебра и геометрия) в средней общеобразовательной школе дало следующие результаты по 10-балльной шкале для класса, обучающегося по программе «Развивающего обучения» (7 «Б»), и класса, обучающегося по традиционной системе (7 «А»):
Определите, превосходят ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по математике.
Сравнение результатов показывает, что баллы, полученный за контрольную работу, в 7 «Б» классе несколько выше, поэтому первой считаем выборку результатов 7 «Б» класса. Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной. Если можно, то это будет означать, что класс, обучающийся по системе «развивающего обучения» имеет более качественные знания по математике. В противном случае, на выбранном уровне значимости различие окажется несущественным. Для оценки различий между двумя малыми выборками (в данном примере их объёмы равны: n1=12, n2=11) используем критерий Манна-Уитни. Проранжируем представленную таблицу:
При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания. Например, 4 балла получили 3 ученика (см. таблицу). Значит, первые 3 позиции в расположении займёт балл, равный 4. Поэтому ранг для 4 баллов – это среднее арифметическое для позиций 1, 2 и 3, или: . Аналогично рассуждаем при вычислении ранга для балла, равного 5. Такой балл получили двое учащихся. Значит, при распределении по возрастанию первые три позиции занимает балл, равный 4, а четвёртую и пятую позиции займёт балл, равный 5. Поэтому его ранг будет равен среднему арифметическому между числами 4 и 5, т.е. 4.5. Используя предложенный принцип ранжирования, получим таблицу рангов. Заметим, что выбор среднего арифметического в качестве ранга применяется при любом ранжировании, в том числе необходимого и для вычисления других критериев достоверности или же коэффициента корреляции Спирмена. Чтобы использовать критерий Манна-Уитни, рассчитаем суммы рангов рассматриваемых выборок (см. таблицу). Сумма для первой выборки равна 168,5, для второй – 107,5. Обозначим наибольшую из этих сумм через Tx (Tx=168.5). Среди объёмов n1 и n2 выборок наибольший обозначим nx. Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:
Tx=168,5, nx=12>11=n2. Тогда:
Критическое значение критерия находим по специальной таблице. Пусть уровень значимости равен 0.05. Гипотеза H0 о незначительности различий между баллами двух классов принимается, если uкр<uэмп. В противном случае H0 отвергается и различие определяется как существенное.
Следовательно, различия в уровне знаний по математике среди учащихся можно считать несущественными. Схема использования критерия Манна-Уитни выглядит следующим образом
|