Классическая теория, основанная на нормальном законе распределения, при малых выборках неприменима. В этом случае используются другие законы распределения, разработанные микростатистикой: распределения Стьюдента и Фишера.
- распределение Стьюдента. Известно, что если из нормально распределенной совокупности значений случайной величины путем
- кратного независимого выбора взять выборки объемом
, то средние значения этих выборок будут тоже распределены нормально с тем же средним значением, но с меньшей дисперсией, т.е.
.
Отношение отклонения выборочного среднего значения от его математического ожидания
(среднее значение генеральной совокупности) к основной ошибке
называется
статистикой. Эта статистика имеет нормальное распределение с равным нулю средним значением и равной 1 дисперсией
.
При научных исследованиях дисперсия генеральной совокупности почти всегда неизвестна и поэтому нельзя выполнить нормирование. По выборке можно определить несмещенную оценку
дисперсии
.
Отклонение выборочного среднего значения от среднего значения генеральной совокупности, нормированное при помощи этой оценки, называется статистикой:
.
При =30
- распределение практически мало отличается от нормального распределения. При малых значениях
- распределение заметно отличается от нормального распределения. Оно более островершинное.
- распределение Фишера. Рассмотрим распределение статистики
. Имеются две независимые выборки разных объемов, средние значения которых
и
. По данным этих выборок получены оценки
и
дисперсий генеральных совокупностей с числами свободы
и
.
Требуется выяснить, являются ли эти оценки существенно различными, или данные выборки можно рассматривать как взятые наудачу из нормальных генеральных совокупностей, имеющих равные дисперсии .
Для решения этой задачи применяется статистика , называемая дисперсионным отношением. Статистика
представляет отношение оценок
и
, полученных из независимых выборок, взятых наудачу из нормальных генеральных совокупностей с одинаковой дисперсией
:
при
>
.
- распределение Фишера выражает вероятность того, что некоторое значение
будет больше или равно
:
- распределение не зависит от дисперсии генеральной совокупности, а зависит от чисел степеней свободы. График плотности распределения приведен на рис. 1.8.
Рис. 1.8. - распределение Фишера
Статистика чаще всего применяется при дисперсионном анализе, в котором требуется только односторонний критерий значимости. Нулевая гипотеза, которая проверяется при помощи статистики
, состоит в том, что выборки взяты из одной нормальной генеральной совокупности или из разных нормальных генеральных совокупностей, имеющих равные дисперсии.
Распределения Фишера и Стьюдента используются при формировании выборки из выборок малого объема и установлении статистической значимости случайных величин, параметров и уравнений.
Малая выборка содержит мало информации об интересующем свойстве. Для получения более надежных выводов требуется объединить малые выборки в одну, но при этом необходимо установить их однородность. Совокупности однородны, если их математические ожидания равны.
Критериями для сравнения выборок служат: равенство двух выборочных дисперсий, равенство двух выборочных средних и однородность ряда выборочных дисперсий.
Критерий однородности ряда дисперсий. Однородность дисперсий ошибок измерений случайной величины в случае равного объема выборок оценивают по критерию Кохрена, расчетное значение которого определяют по формуле
,
где - дисперсия ошибок измерения СВ
- й выборки;
- число выборок.
Критическое значение критерия определяют по таблице (приложение 1) при заданных значениях уровня значимости и степенях свободы:
;
, где
- число измерений (объем выборки).
Пример 1.3. При определении предела прочности получены следующие значения дисперсий ошибок измерений пяти партий бетона: 2,5; 2,8; 3,2; 2,4; 2,7. Ошибки во всех случаях подсчитывались по 17 – ти измерениям.
Оценить однородность дисперсий ошибок измерений прочности, т.е. возможность проведения дисперсионного анализа.
Определяем расчетное значение критерия
=
=0,235.
Критическое значение критерия при и
равно 0,3645. Таким образом,
, гипотеза об однородности дисперсий ошибок измерений подтверждается с вероятностью 95 % и можно проводить дисперсионный анализ. Результаты расчета в среде ЭТ приведены в таблице 1.5.
Т а б л и ц а 1.5
Расчет в среде ЭТ
Критерий равенства двух дисперсий. Для сравнения дисперсий двух выборок используют - критерий Фишера. Определяют расчетное значение
- критерия в виде отношения большей дисперсии к меньшей
.
Так как проверяется гипотеза о равенстве генеральных дисперсий, то желательно, чтобы это отношение было как можно ближе к единице. Критическое значение - критерия вычисляем с помощью статистической функции
РАСПОБР. Число степеней свободы принимают соответственно
, где
- объем выборки. Гипотеза о равенстве дисперсий подтверждается, если
.
Критерий равенства двух средних. Для сравнения двух выборочных средних используют - статистику. После проверки гипотезы о равенстве двух выборочных дисперсий, вычисляют общую дисперсию двух выборок и расчетное значение
- статистики по формулам:
.
Критическое значение - статистики определяем с помощью статистической функции СТЬЮДРАСПОБР. Число степеней свободы
. Гипотеза о равенстве средних значений подтверждается, если
.
Пример 1.4. Сравним результаты испытаний двух выборок образцов бетона. В первой выборке объемом 29 образцов средний предел прочности =40,1 МПа, дисперсия
=8,2. Во второй выборке объемом 13 образцов средний предел прочности
=40,9 МПа, дисперсия
=7,1.
Расчетное значение - критерия:
=8,2/7,1=1,155.
Диалоговое окно функции РАСПОБР представлено на рис. 1.9.
Степени свободы
=28+12=40. Критические значения
- критерия при различных значениях уровня значимости приведены в таблице 1.6.
Рис. 1.9. Диалоговое окно функции FРАСПОБР
Т а б л и ц а 1.6
Результаты расчета в среде ЭТ
Так как расчетное значение - критерия меньше критических значений при всех уровнях значимости, то гипотеза о равенстве дисперсий подтверждается.
Определим общую дисперсию
Вычислим расчетное значение - статистики.
Критические значения - статистики при различных значениях уровня значимости приведены в таблице 1.6.
.
Расчетное значение - статистики при всех уровнях значимости меньше критического значения. Следовательно, между средними значениями прочности бетона двух выборок нет существенного различия.
Для установления статистической значимости случайной величины определяют расчетное значение - статистики по формуле
и сравнивают его с критическим значением . Если
, то СВ статистически значима.
Пусть при испытании 5 – ти образцов оказалось, что среднее значение прочности на сжатие равно МПа, а стандартное отклонение
МПа.
Расчетное значение
.
Критическое значение при равно
. Так как
, то данное среднее значение прочности на сжатие статистически значимо.