Оценка параметров распределения

Если в теории вероятностей для заданного вида распределения параметры определяются однозначно, то в математической статистике такие параметры являются случайными, они вычисляются по выборочным значениям, которые меняются от одной выборки к другой. Поэтому такие случайные значения параметров называют их точечными оценками, т.е. оценками, которые характеризуют искомый параметр одним числом.

Определение. Статистической оценкой параметра теоретического распределения (т.е. распределения количественного признака генеральной совокупности) называют его приближенное значение, зависящее от выборки: . Функцию результатов наблюдений называют статистикой.

Замечание. Если число наблюдений мало, то замена искомого параметра его оценкой, например математического ожидания средним арифметическим, приводит к ошибке. По этой причине, и некоторым другим, к оценке любого параметра предъявляется ряд требований, которым должна удовлетворять оценка хорошего качества, а именно: несмещенность, состоятельность и эффективность. Требование несмещенности указывает на отсутствие систематической ошибки. Требование состоятельности предполагает, что оценка приближается к истинному значению параметра с ростом числа наблюдений.

Замечание. На практике не всегда удается подобрать оценки, удовлетворяющие всем трем критериям.

Рассмотрим далее точечные оценки математического ожидания, т.е. оценку будем вычислять по выборке.

Пусть − выборка, полученная в результате проведения независимых наблюдений за случайной величиной . Представим значения как набор значений случайных величин , т.е. под будем понимать значение случайной величины в -ом наблюдении.

Эти случайные величины можно рассматривать как независимых случайных величин. Поэтому .

Теорема. Если − выборка из генеральной совокупности и , то выборочное среднее − несмещенная и состоятельная оценка математического ожидания .

Замечание. Относительная частота () появления случайного события в независимых наблюдениях является несмещенной, состоятельной и эффективной оценкой вероятности этого события ().

В случае, когда объем выборки невелик, точечные оценки приводят к ошибкам, т.к. дают большую погрешность. Этого недостатка лишены интервальные оценки неизвестного параметра , т.е. те, которые определяются концами интервала.

Определение. Интервал , покрывающий с вероятностью истинное значение параметра , называется доверительным интервалом, а число − надежностью оценки или доверительной вероятностью.

Чаще всего доверительный интервал выбирают симметричным относительно несмещенной точечной оценки параметра , т.е. , где число характеризует точность оценки.

Надежность принято выбирать равной 0,9; 0,95; 0,99; 0,999, т.е. когда почти достоверно, что доверительный интервал покрывает оцениваемый параметр.

Рассмотрим интервальную оценку для математического ожидания нормального распределения.

Пусть − выборка, полученная в результате проведения независимых наблюдений за случайной величиной , для которой известно среднее квадратическое отклонение . Зададим доверительную вероятность равной . Оценкой математического ожидания является выборочное среднее , которое, как и сама величина , распределено по нормальному закону.

Рассмотрим случайную величину . Определим параметры её распределения:

, .

Используем формулу теории вероятностей вероятности попадания в интервал для нормально распределенной случайной величины: . Тогда для случайной величины имеем: , где . Из последнего равенства находим , (из этой формулы следует, что с возрастанием объема выборки точность оценки увеличивается, а увеличение надежности уменьшает точность оценки), следовательно . Таким образом, интервал - доверительный интервал для . Поскольку было задано, то по таблице значений функции Лапласа из равенства находим аргумент t.

Пример. Найти доверительный интервал с надежностью =0,95 для неизвестного математического ожидания (оцениваемый параметр нормального распределения) по выборочному среднему при известном среднем квадратическом отклонении, если выборочное среднее = 48,11, среднее квадратическое отклонение = 12,29 и объем выборки = 50.

Решение.

Воспользуемся подходящей формулой . Из уравнения или по таблице находим = 1,96. Точность равна . Следовательно, доверительный интервал для неизвестного математического ожидания при известном имеет вид или . Этот интервал с вероятностью 0,95 покрывает математическое ожидание.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: