Проблемы статистических выводов традиционно делятся на проблемы оценивания и проверку гипотез. Главное различие между этими двумя проблемами состоит в том, что при оценивании мы должны определить величину параметра или нескольких параметров. В то время как при проверке гипотез мы должны решить: принять или отвергнуть специфическую величину (или ряд специфических величин) параметра или нескольких параметров.
В общем виде задача оценки параметров формулируется следующим образом.
Пусть распределение признака Х - генеральной совокупности - задается функцией вероятности f (xi, θ) = P (X = xi) для дискретной случайной величины или плотностью вероятностей f (x, θ) для непрерывной случайной величины, которая содержит неизвестный параметр θ.
Для вычисления параметра θ используют выборку x 1, x 2,..., xn, каждая из которых имеет один и тот же закон распределения, что и признак Х.
Оценкой θ n параметра θ называют всякую функцию результатов наблюдений (иначе - статистику), с помощью которой делают вывод о значении параметра θ:
θ n = θ n (x 1, x 2,..., xn).
Так как x 1, x 2,..., xn - случайные величины, то и оценка θ n является случайной величиной, которая зависит от закона распределения и объема выборки n. Оцениваемый параметр θ является постоянной величиной.
Всегда существует множество функций от результатов наблюдений x 1, x 2,... xn, которые можно предложить в качестве оценки параметра θ. Например, для математического ожидания в качестве оценки θ n по выборке можно взять среднюю арифметическую результатов наблюдений , моду M 0, медиану Me и т. д.
Так как θ n - случайная величина, то невозможно предсказать индивидуальное значение оценки в данном частном случае. Поэтому о качестве оценки следует судить не по ее индивидуальным значениям, а по распределению ее значений при достаточно большом числе испытаний, т. е. по выборочному распределению оценки.
Cвойства оценок:
1. Оценка θ n параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т. е. M (θ n) = θ.
В противном случае оценка называется смещенной. Если это равенство не выполняется, то оценка θ n, полученная по разным выборкам, будет либо завышать θ, если M (θ n) > θ, либо занижать его, если M (θ n) < θ. Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.
2. Оценка θ n параметра θ называется состоятельной, если она удовлетворяет закону больших чисел, т. е. сходится по вероятности к оцениваемому параметру
Если оценка состоятельна, то практически достоверно, что при достаточно большом n θ n ≈ θ.
3. Несмещенная оценка θ n параметра θ является эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра θ, вычисленных по выборкам одного и того же объема n. Так как для несмещенной оценки M (θ n – θ)2 есть дисперсия , то эффективность является решающим свойством, определяющим качество оценки.
В качестве статистических оценок параметров генеральной совокупности желательно использовать оценки, удовлетворяющие одновременно требованиям несмещенности, состоятельности и эффективности.
4. Оценка θ n параметра θ является достаточной, если при заданном ее значении распределение наблюдения Х не зависит от параметра θ. Иначе, оценка θ n обеспечивает оценку параметра без потери информации, содержащейся в выборке.
Однако на практике не всегда оценки удовлетворяют всем трем требованиям. Может оказаться, что даже если эффективная оценка существует, то формулы для ее вычисления оказываются слишком сложными, и тогда используют оценку, дисперсия которой несколько больше. Иногда, в интересах простоты расчетов, применяются незначительно смещенные оценки. Выбору оценки всегда должно предшествовать ее критическое рассмотрение.
Свойства оценок.
Параметр (генеральная характеристика) | Оценка (выборочная характеристика) | Свойства оценки | ||||
несме-щенная | состоя-тель-ная | эффек-тивная | доста-точная | |||
Средняя | Да | Да | Да | Да | ||
Дисперсия | - исправленная выборочная дисперсия | Нет Да | Да Да | Нет Да | Да Да | |
Доля | Да | Да | Да | Да | ||
Мода | М0(Х) | Да | Да | Нет | Нет | |
Медиана | Ме(Х) | Да | Да | Нет | Нет |