Æ Выборочными характеристиками называются функции от наблюдений, приближённо оценивающие соответствующие числовые характеристики случайной величины.
Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные.
Точечныеоценки выражаются одним числом (точкой на числовой оси), находятся такие оценки по данным выборки и используются в дальнейшем вместо оцениваемого параметра. Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте.
Интервальные оценки определяются двумя числами – концами интервала, который накрывает оцениваемый параметр.
В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок.
Если объём выборки , то при построении доверительного интервала для математического ожидания можно пользоваться нормальным законом распределения. В случае неизвестной дисперсии для определения ширины интервала используют несмещённую оценку дисперсии и соответствующее выборочное среднее квадратическое отклонение [2] .
|
|
К точечным оценкам предъявляют требования, которым они должны удовлетворять, чтобы хоть в каком-то смысле быть «доброкачественными». Это несмещённость, эффективность и состоятельность [1].
В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение:
1) выборочное среднее: ;
2) выборочная смещённая (неисправленная) дисперсия:
, или
;
3) выборочная несмещённая (исправленная) дисперсия:
, или ;
4) смещённое выборочное среднее квадратическое отклонение:
;
5) несмещённое выборочное среднее квадратическое отклонение:
.
Þ Примечание. Выборочное среднее есть несмещённая, эффективная и состоятельная точечная оценка математического ожидания, в то время как, выборочная дисперсия является смещённой точечной оценкой дисперсии. В этом случае вводят исправленную (несмещённую) точечную оценку дисперсии [3].
В качестве других используемых на практике выборочных характеристик можно назвать выборочную моду и выборочную медиану [3].
Для наблюдений дискретной случайной величины:
- выборочная мода равна значению варианты с наибольшей частотой ;
- выборочная медиана равна значению варианты, стоящей в середине вариационного ряда, если число наблюдаемых вариант есть нечётное число;
|
|
- есличисло наблюдаемых вариант есть чётное число, тогда выборочная медиана равна полусумме двух соседних значений вариант, стоящих в середине вариационного ряда.
Медиана есть серединный элемент.
В том случае, когда наблюдения проводятся для непрерывной случайной величины, то мода и медиана определяются по следующим правилам.
Что касается моды , то сначала определяется модальный интервал, т. е. интервал с наибольшей частотой (или относительной частотой). Затем мода вычисляется по формуле
, (1)
здесь - начало модального интервала, имеющего максимальную частоту , - частота модального интервала, - длина модального интервала, и - частоты интервалов соответственно предшествующего и последующего за модальным интервалом.
Медианой называют такое число , когда 50% вариант выборки меньше или равна этого значения, а 50% - больше или равна его, т. е. .
Медиану определяем по следующему алгоритму:
1) найдите медианный интервал . Это такой интервал, для которого накопленная частота , в этом случае медиана ;
2) вычислите медиану по одной из формул:
, (2)
или
, (3)
здесь - начало медианного интервала, - ширина медианного интервала, - объём выборки, - накопленная частота интервала, предшествующего медианному интервалу, - частота медианного интервала, - накопленная относительная частота медианного интервала, - накопленная относительная частота интервала, предшествующего медианному интервалу.
?Упражнение 3. Найдите выборочное среднее, смещённую и несмещённую выборочные дисперсии, смещённое и несмещённое выборочные средние квадратические отклонения, моду и медиану по данному распределению выборки:
Решение
В упражнении рассматривается дискретная случайная величина. Вычисления выполним в MS Excel.
Варианта | Частота | Относительная частота | Накопленная частота | Произведение варианты на частоту | Произведение квадрата варианты на частоту |
0,2 | 0,2 | ||||
0,3 | 0,5 | ||||
0,1 | 0,6 | ||||
0,4 | |||||
Объём выборки: | |||||
Выборочное среднее: | 4,2 | 20,4 | |||
Смещённая выборочная дисперсия: | 2,76 | ||||
Несмещённая выборочная дисперсия: | 2,82 | ||||
Смещённое выборочное среднее квадратическое отклонение: | 1,66 | ||||
Несмещённое выборочное среднее квадратическое отклонение: | 1,68 | ||||
Мода М0 = 3, наибольшая частота равна 15. | |||||
Медиана Ме = (3+5)/2 = 4 - среднее арифметическое двух серединных элементов. |
Þ Примечание. В данном примере чётное количество вариант, а именно 4, это 2, 3, 5, и 6. Поэтому медиану определяем как среднее значение дух серединных элементов:
Несмещённая выборочная дисперсия вычисляется по формуле:
?Упражнение 4. Найдите выборочное среднее, выборочную дисперсию (смещённую и несмещённую), выборочное среднее квадратическое отклонение (смещённое и несмещённое) по данному распределению выборки:
Частичный интервал | [2,7) | [7,12) | [12,17) | [17,22) | [22,27) |
Число наблюдений, попавших в интервал, |
Решение
В данном упражнении наблюдения выполнены для непрерывной случайной величины. Здесь обязательно надо найти середины исследуемых интервалов. Именно таким образом поставленную задачу сведём к исследованию дискретной случайной величины. Вычисления выполним в MS Excel.
Частичный интервал | Частота | Относитель- ная частота | Накоплен-ная относительная частота | Начало интервала | Конец интервала | Середина интервала | Произведе- ние середины интервала на частоту |
[2; 7) | 0,1 | 0,1 | 4,5 | 22,50 | |||
[7; 12) | 0,2 | 0,3 | 9,5 | 95,00 | |||
[12; 17) | 0,5 | 0,8 | 14,5 | 362,50 | |||
[17; 22) | 0,12 | 0,92 | 19,5 | 117,00 | |||
[22; 27) | 0,08 | 24,5 | 98,00 | ||||
Объём выборки: | 695,00 | ||||||
Длина интервала: | Выборочное среднее: | 13,90 | |||||
Мода М0: | 14,21 | ||||||
Медиана Ме: | 17,00 |
Þ Примечание. В данном примере максимальная частота , [12; 17) - модальный интервал, моду вычисляем по формуле (1):
|
|
Интервал [7; 12) является медианным интервалом, поскольку накопленная относительная частота равна 0.3, а это значение меньше, чем 0.5, т. е. Медиану можно вычислить по одной из формул (2) или (3):
Найдём
- выборочную дисперсию (смещённую и несмещённую оценки);
- выборочное среднее квадратическое отклонение (смещённую и несмещённую оценки), для чего выполним дополнительные вычисления.