Параметрическое оценивание закона распределения

Результаты предварительной обработки наблюдений случайной величины, дополненные сведениями о сущности изучаемого явления, зачастую оказываются достаточными для того, чтобы сформулировать гипотезу о модели закона распределения изучаемой случайной величины, нормальный ли этот закон, биномиальный или какой-либо другой. Используя наблюдения, можно найти оценки параметров предполагаемой модели, т.е. оценки входящих в модель числовых характеристик. Подставив в модель вместо параметров найденные оценки, получим оценку предполагаемой модели закона распределения, которая называется параметрической. Оценивание закона распределения, не требующее предварительного выбора его модели и оценивания входящих в неё параметров, называется непараметрическим. Примерами непараметрических оценок неизвестного закона распределения являются вариационный ряд, выборочная функция распределения и выборочная плотность распределения.

Рассмотрим два примера параметрического оценивания закона распределения: в первом примере случайная величина дискретна, во втором – непрерывна.

Пример 3. Дано случайное распределение успеваемости 100 студентов-заочников, сдававших четыре экзамена:

Число сданных экзаменов          
Число студентов          

Здесь случайной величиной является число сданных экзаменов среди четырёх. Обозначим её Х. Установим закон распределения этой величины.

Построим сначала его непараметрическую оценку. Величина Х – дискретная. Дискретный вариационный ряд, заданный столбцами 2 и 4 табл. 5, даёт непараметрическую оценку закона распределения числа сданных экзаменов среди четырёх сдаваемых.

Теперь сформулируем гипотезу о модели закона распределения случайной величины Х – числе сданных экзаменов среди четырёх сдаваемых. Процесс сдачи четырёх экзаменов представим как четыре испытания, относительно которых сделаем следующие допущения:

Таблица 5.

I Число сданных экзаменов xi Число студентов mi Частость pi теор= = mi теор= npi теор (mimi теор)2 (mi – - mi теор)2: : mi теор
               
    1 5 0,01 0,01 0,03 0,35 0,60 0,00021 0,00608 0,06691 0,32711 0,59969 0,021 0,608 7,32 6,691 32,711 59,969   5,382 5,239 0,001   0,735 0,160 0,000
Итого n = 100 1,00 1,00000     0,895

- эти испытания независимы, т.е. вероятность сдачи любым студентом любого экзамена не зависит от того, будет сдано или нет любое количество других экзаменов;

- вероятность сдачи студентом любого отдельно взятого экзамена одна и та же и равна р, а вероятность «несдачи» равна (1 – р).

Конечно, эти допущения могут вызывать некоторые сомнения, но возможно, что они не будут противоречить результатам наблюдений. При этих допущениях мы имеем дело с испытаниями Бернулли и число сданных экзаменов среди четырёх сдаваемых будет иметь биномиальный закон распределения, т.е. вероятность того, что студент сдаст λ экзаменов, равна

Р(Х = х) = С4хрх(1 – р)4 – х, х = 0, 1, 2, 3, 4. (6)

Найдём оценку параметра р, входящего в модель (6). В условиях испытаний Бернулли состоятельной, несмещённой и эффективной оценкой вероятности является частость. В рассматриваемом примере р – вероятность того, что студент сдаст экзамен, поэтому частость р* этого события, учитывая, что имеются сведения об успеваемости 100 студентов, вычисляем следующим образом:

р* = = =0,88.

Так как - это среднее число экзаменов, сданных одним студентом, то р* можно было бы определить и так:

р* = = = 0,88.

Заметим, что если находить оценку параметра р в модели (6) методом максимального правдоподобия и при этом учесть, что число xi наблюдалось mi раз, то мы получили бы для р* такую же формулу, а именно

р*мп = .

Подставив в модель (6) вместо параметра р его оценку р*, получим параметрическую оценку неизвестного закона распределения числа сданных экзаменов, построенную в предположении, что допустима биномиальная модель

Р (Х = х) = С 4 х 0,88 х 0,124 – х ; х = 0, 1, 2, 3, 4. (7)

Теоретические вероятности pi теор и частоты mi теор, вычисленные в предположении, что имеет место модель (7), содержатся в столбцах 5 и 6 табл. 5. Поскольку различия между соответствующими числами столбцов 4 и 5 или между числами столбцов 3 и 6 небольшие, можно сделать предварительное заключение о приемлемости биномиальной модели. Графически это заключение подтверждается рисунком, на котором кривая вероятностей pi теор близка к кривой частостей pi *.

Метод более глубокого обоснования приемлемости той или иной модели называется критерием согласия.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: