Средние величины. Характеризуют значения признака, вокруг которого концентрируются наблюдения.
1. Средняя арифметическая .
Основные свойства средней арифметической:
a) средняя арифметическая постоянной равна самой постоянной;
b) если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз;
c) или ;
d) если все варианты увеличить (уменьшить) на одно и то же число, то средняя арифметическая увеличится (уменьшится) на то же число;
e) или ;
f) средняя арифметическая отклонений вариантов от средней арифметической равна нулю: или ;
g) средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков;
h) ;
i) если ряд состоит из нескольких групп, то общая средняя равна средней арифметической групповых средних, причем весами являются объемы групп: .
Структурные или порядковые средние:
Медианой вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.
|
|
Модой вариационного ряда называется вариант, которому соответствует наибольшая частота.
Показатели вариации:
1. Вариационный размах .
2. Среднее линейное отклонение – средняя арифметическая абсолютных величин отклонений вариантов от их средней арифметической: .
3. Дисперсия .
4. Среднее квадратическое отклонение .
5. Коэффициент вариации: равен процентному отношению среднего квадратического отклонения к средней арифметической %.
Основные свойства дисперсии, аналогичные свойствам дисперсии случайной величины:
a. Дисперсия постоянной равна нулю.
b. Если все варианты увеличить (уменьшить) в одно и то же число к, то дисперсия увеличится (уменьшится в раз): .
c. Если все варианты увеличить (уменьшить) на одно и то же число, то дисперсия не измениться.
d. Дисперсия равна разности между средней арифметической квадратов вариантов и квадратом средней арифметической: .
e. Если ряд состоит из нескольких групп наблюдений, то общая дисперсия равна сумме средней арифметической групповых дисперсий и межгрупповой дисперсии: , – межгрупповая дисперсия; – средняя арифметическая групповых дисперсий.
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Оценкой параметра называют всякую функцию результатов наблюдений над случайной величиной Х (иначе статистику), с помощью которой судят о значении параметра : .
Оценка в отличие от оцениваемого параметра является случайной величиной.
Например, для оценки математического ожидания нормального распределения служит функция – среднее арифметическое наблюдаемых значений признака.
|
|
Несмещенной называют статистическую оценку (тета), математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т. е.
.
Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Пояснение. Пусть – стат. оценка неизвестного параметра теоретического распределения. Беря разные выборки одного и того же объема получаем оценки , которые различны между собой. – как случайная величина, а ее значения. Если дает приближенное значение с избытком, тогда каждое найденное значение больше истинного значения . Тогда и . Если дает оценку с недостатком, то . Таким образом, использование такой оценки привело бы к систематическим (одного знака) ошибкам.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру.
или .
Примеры оценок: выборочная дисперсия есть смещенная и состоятельная оценка генеральной дисперсии; выборочное среднее является несмещенной и состоятельной оценкой.
Интервальной называют оценку, которая определяется двумя числами – концами интервалов.
Оценка будет тем точнее оценивать параметр , если , где очень маленькое.
Значение характеризует точность оценки.
Надежностью (доверительной вероятностью) оценки называют вероятность , с которой осуществляется неравенство .
Наиболее часто задают надежность равную 0,95; 0,99; 0,999.
Вероятность того, что равна , запишется или . То есть интервал заключает в себе (покрывает) неизвестный параметр с вероятностью .
Доверительным интервалом называют интервал , который покрывает неизвестный параметр с заданной надежностью .
Доверительный интервал для оценки математического ожидания нормального распределения при известном .
Будем рассматривать выборочную среднюю как случайную величину . Математическое ожидание этих величин равно и среднее квадратическое отклонение .
Если случайная величина Х распределена нормально, то выборочная средняя , найденная по независимым наблюдениям также распределена нормально.
Параметры распределения .
Пусть выполняется соотношение с заданной надежностью .
Используя функцию Лапласа . Сделав соответствующую замену, получим:
;
То есть доверительный интервал покрывает неизвестный параметр , точность оценки . Число t определяется по таблице функции Лапласа . Таким образом, получаем интервал:
. (4.1)
Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном .
На практике почти всегда генеральная дисперсия неизвестна.
В этом случае используется следующая формула для построения доверительного интервала:
, (4.2)
где – статистика Стьюдента с уровнем надежности и числом степеней свободы ; – смещенная оценка среднего квадратического отклонения.
Пример 56. Для контроля срока службы электроламп из большой партии было отобрано 17 электроламп. В результате испытаний оказалось, что средний срок службы отобранных ламп равен 980 ч, а среднее квадратическое отклонение их срока службы 18 ч. Найти доверительный интервал для среднего срока службы с вероятностью 0,95.
Решение. По формуле 4.2 найдем доверительный интервал. По данным задачи . По таблице Стьюдента находим .
Тогда .
. То есть с надежностью 0,95 средний срок службы электроламп в партии заключен от 970,5 до 989,5 ч.