Во многих случаях предположение о нормальном распределении случайной величины становится приемлемым при и вполне хорошо оправдывается при . Оценка вполне пригодна для применения вместо . Но не так обстоит дело с дисперсией. Правомочность ее замены на выборочную дисперсию не обоснована даже в указанных случаях. При небольшом объеме выборки, , закон распределения оценки дисперсии принимать за нормальный неоправданно. Ее распределение следует аппроксимировать распределением хи-квадрат как суммы квадратов центрированных величин (хи-квадрат распределение сходится к нормальному при количестве слагаемых, превышающем 30). Но это утверждение обосновано только тогда, когда случайная величина Х распределена нормально.
Рассмотрим случайные величины (исправленную выборочную дисперсию – несмещенную оценку дисперсии ) и . Тогда случайная величина имеет распределение Стьюдента с степенями свободы. Функция плотности распределения этой случайной величины имеет вид . Распределение Стьюдента симметричное, поэтому полученное соотношение между точностью, надежностью оценки и объемом выборки сохраняется. Выберем число так, чтобы выполнялось нера-венство . Из определения функции плотности распределения Стьюдента, значения границ интервала для параметра можно записать как решение интегрального уравнения:
|
|
Решение этого интегрального уравнения обозначается и приводится в статистических таблицах. В данном пособии значения этой величины приведены в приложении, табл. 2. Кроме того, значе-ния при различных и можно получить, используя программы EXCEL, MATHCAD, MAPLE. Соответствующие команды даны в таблице.
MAPLE | |
MATHCAD | |
EXCEL |
Приведем неравенство к эквивалентному виду , или . Это неравенство задает доверительный интервал для математического ожидания с надежностью :
.
Заметим, что полученный доверительный интервал похож на тот, что был получен при условии известной дисперсии: . Разница состоит в том, что неизвестное значение заменяется во втором случае его выборочной оценкой , а числа находятся из распределения Стьюдента, вместо чисел , которые находятся из нормального распределения. Кроме того, при больших объемах выборки можно считать, что, практически, , а . В этом случае можно пользоваться формулами нормального распределения.
Задача 2. В условиях задачи 1 найти доверительный интервал для математического ожидания с надежностью , если дисперсия неизвестна.
Решение задачи 2. Для удобства вычислений и наглядности еще раз представим таблицу значений.
Частичные интервалы | (10;20) | (20;30) | (30;40) | (40;50) |
Частоты | ||||
|
|
Объем выборки составляет = 100. Среднее выборочное значение = 30. Вычислим дисперсию и исправленную дисперсию . Поскольку , то , а исправленная дисперсия = , . Объем заданной выборки доста-точно большой, . Поэтому можно использовать как распределение Стьюдента, так и нормальное распределение. Рассмотрим оба варианта.
Вариант 1 (нормальный закон распределения). Будем полагать, что , а . По заданной надежности найдем, с помощью табл. 1 (приложение), параметр : , откуда , . Получим доверительный интервал для математического ожида-ния .
Проведем вычисления и окончательно запишем, что . Таким образом, интервал покрывает пара-метр с надежностью = 0,95 при неизвестной дисперсии.
Вариант 2 (закон распределения Стьюдента). По заданной надежности = 0,95 найдем, с помощью табл. 2 (приложение), параметр : . Запишем доверительный интервал для математического ожидания
.
Проведем вычисления и окончательно получим, что . Таким образом, интервал покрывает пара-метр с надежностью при неизвестной дисперсии.
Можно заметить, что если значение близко к , то доверительный интервал, полученный с применением закона распределения Стьюдента, будет более широким, чем доверительный интервал, полученный с применением формул нормального распределения, так как . Это объясняется тем, что распределение Стьюдента применяется при выборках малых объемов, содержащих недостаточный объем информации.
Задача 3. По данным наблюдений случайной величины , распределенной нормально, найти доверительный интервал для математического ожидания с надежностью . Выборка представлена таблицей.
Частичные интервалы | (5;10) | (10;15) | (15;20) | (20;25) | (25;30) |
Частоты | |||||
7,5 | 12,5 | 17,5 | 22,5 | 27,5 |
Решение задачи 3. Найдем объем выборки: . Поскольку объем выборки невелик, то применение нормального закона распределения приведет к неоправданному сужению доверительного интервала, поэтому используем формулы, полученные для распределения Стьюдента. Вычислим необходимые параметры:
,
,
,
, .
По заданной надежности = 0,95 найдем, с помощью табл. 2 (приложение), параметр : . Доверитель-ный интервал для математического ожидания
или . Таким образом, интервал покрывает параметр с надежностью = 0,95 при неизвестной дисперсии.