Метод доверительных интервалов разработан американским статистиком Ю.Нейманом, исходя из идей английского статистика Р.Фишера.
Нахождение границ доверительного интервала непосредственно зависит от закона распределения величины (это случайная величина), который, в свою очередь, определяется законом распределения случайной величины Х и, следовательно, зависит от его параметров (в частности, и от самого параметра а).
Ниже мы рассмотрим, как построить доверительный интервал для оценки математического ожидания М(х), среднего квадратического отклонения и вероятности события Р для известных законов распределения: нормального, биномиального.
3. Доверительный интервал для оценки математического ожидания нормально распределенной случайной величины |
Пусть известно, что случайная величина Х имеет нормальное распределение, но неизвестен ее параметр а (математическое ожидание).
Допустим, что точечную оценку параметра а по выборочной средней нашли, т.е. . Надо определить точность этой приближенной формулы при заданной надежности .
|
|
Эта задача решается в двух случаях: 1) когда параметр известен; 2) когда параметр неизвестен.
а) построение доверительного интервала для математического ожидания при известном .
, (**)
где: - заданная надежность (вероятность);
n – объем выборки;
t – значение аргумента функции Лапласа Ф(t), при котором (см. приложение 2);
- точность оценки.
Исходя из обозначений для доверительного интервала нормально распределенной случайной величины имеем:
, где - функция Лапласа, значения которой приведены в приложении №2 Гмурман В.Е.
Если задана доверительная вероятность и объем выборки n, то из уравнения пользуясь таблицей Лапласа, можно найти значение аргумента , а отсюда .
Величина t – случайная и при известном имеет нормальное распределение, как и случайная величина Х. Величина t определяет число средних квадратических отклонений , которые надо отложить вправо и влево от центра рассеивания.
Заметим, что рассмотренную нами формулу (**) построения доверительного интервала для математического ожидания при известном , можно использовать при достаточно больших n и в случае, если закон распределения не является нормальным. В этом случае .
б) построение доверительного интервала для математического ожидания при неизвестном .
Пусть случайная величина Х – нормально распределена и неизвестна. Тогда:
,
где: - (в Гмурмане В.Е. обозначается s) необходимо определить по формуле точечной оценки параметра при , т.е. ;
- находят по таблице приложения 3 (Гмурман В.Е.) по заданным n и .
4. Доверительный интервал для оценки среднего квадратического отклонения нормально распределенной случайной величины Допустим, что найдена точечная оценка для равная , т.е. . Требуется найти доверительный интервал , накрывающий параметр с надежностью . Потребуем выполнения соотношения . Преобразуем двойное неравенство в равносильное неравенство . Обозначив ,получим при . При формула имеет вид . Для отыскания q составлена специальная таблица (см. приложение 4 Гмурман В.Е.). Вычислив по выборке и определив по таблице значение q, получим искомый доверительный интервал: , где . |
4. Доверительный интервал для определения вероятности события Р (генеральной доли) при большом количестве опытов или большом объеме выборки |
или в наших обозначениях предыдущей лекции .
|
|
Точечной оценкой вероятности Р события служит частота события. Для определения точности вычисления Р надо найти и записать .
Величины и n в этом случае связаны выражением:
,
где: - функция Лапласа, значения которой см. в Приложении 2 Гмурман В.Е.;
- частота появления события;
- частота не появления события.
Замечание. Если величины m и n неизвестны, то принимают , так как принимает максимальное значение при .
Замечание. Вы помните из прошлой лекции, что при больших n (порядка сотен) биномиальное распределение стремиться к нормальному.
Интервальной оценкой (с надежностью ) неизвестной вероятности Р биномиального распределения по относительной частоте w при больших n служит доверительный интервал:
,
где t – определяется по таблицам функции Лапласа (приложение 2) из соотношения .
В этом случае для оценки генеральной доли Р нормально распределенного количественного признака по выборочной доле w будет использоваться формула:
.