double arrow

Статистические оценки параметров распределения


Изучается количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение. Например, если наперёд известно, что изучаемый признак распределён в генеральной совокупности нормально, то необходимо оценить математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, например значения количественного признака . . . , , полученные в результате наблюдений. Через эти данные и выражают оцениваемый параметр. Рассматривая . . . , как независимые случайные величины , , … , , можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближённое значение оцениваемого параметра.

Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Для того, чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определённым требованиям.

Пусть - статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объёма найдена оценка . повторим опыт, т.е. извлечём из генеральной совокупности другую выборку того же объёма и по её данным найдём оценку . Продолжая так и далее получим числа , , … , , которые, вообще говоря, различны между собой. Таким образом, оценку можно рассматривать как случайную величину, числа , , … , - как её возможные значения. Пусть оценка даёт приближённое значение с избытком; тогда каждое найденное по данным выборок число больше истинного значения . Ясно, что в этом случае и математическое ожидание случайной величины больше, чем , т.е. . Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Хотя соблюдение этого требования не устранит ошибок, однако ошибки разных знаков будут встречаться одинаково часто. Иными словами, соблюдение требований гарантирует от получения систематических ошибок.

Несмещённой называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объёме выборки, т.е. .

Смещённой называют оценку, математическое ожидание которой не равно оцениваемому параметру.

Однако было бы ошибочным считать, что несмещённая оценка всегда даёт хорошее приближение оцениваемого параметра. Возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия может быть значительной. Если же потребовать, чтобы дисперсия была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.

Эффективной называют статистическую оценку, которая при заданном объёме выборки имеет наименьшую возможную дисперсию.

При рассмотрении выборок большого объёма к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещённой оценки при стремится к нулю, то такая оценка оказывается и состоятельной.

Пусть изучается дискретная генеральная совокупность относительно количественного признака .

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.

Если все значения , , … , признака генеральной совокупности объёма различны, то

.

Если же значения признака , , … , имеют соответственно частоты … , причём +… + , то

.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

Если все значения , , … , признака выборки объёма различны, то

.

Если же значения признака , , … , имеют соответственно частоты … , причём +… + , то

.

Допустим, что все значения количественного признака совокупности, безразлично-генеральной или выборочной, разбиты на несколько групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти её среднюю арифметическую.

Групповой средней называют среднее арифметическое значений признака, принадлежащих группе.

Общей средней называют среднее арифметическое значений признака, принадлежащих всей совокупности. Общая средняя равна средней арифметической групповых средних, взвешенной по объёмам групп.

Рассмотрим совокупность значений количественного признака объёма :

Найдём общую среднюю: . Так как - постоянная величина, то .

Отклонением называется разность между значением признака и общей средней: - . Заметим, что сумма произведений отклонений на соответствующие частоты равна нулю, т.е. В самом деле .

Генеральной дисперсией называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения .

Если все значения , , … , признака генеральной совокупности объёма различны, то

.

Если же значения признака , , … , имеют соответственно частоты … , причём +… + , то

.

Генеральным средним квадратическим отклонением называют квадратный корень из генеральной дисперсии: .

Выборочной дисперсией называется среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .

Если все значения , , … , признака выборки объёма различны, то

.

Если же значения признака , , … , имеют соответственно частоты … , причём +… + , то

.

Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии: .

Теорема. Дисперсия (безразлично-выборочной или генеральной) равна среднему квадратов значений признака минус квадрат общей средней , т.е. .

Доказательство.

, где , = .

Групповой дисперсией называют дисперсию значений признака, принадлежащих группе, относительно групповой средней

,

где - частота значения ; j – номер группы; - групповая средняя группы j; - объём группы j.

Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объёмам групп

,

где - объём группы j; - объём всей совокупности.

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней

,

где - групповая средняя группы j; - объём группы j; - общая средняя; – объём всей совокупности.

Общей дисперсией называют дисперсию значений признака всей совокупности относительно общей средней

,

где - частота значения ; - общая средняя; - объём всей совокупности.

Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда, а именно: мода и медиана.

Модой называется варианта, которая имеет наибольшую частоту. Так, например, для ряда

1 4 7 9

5 1 20 6

мода равна 7.

Медианой называется варианта, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечётно, т.е. , то , при чётном медиана . Например, для ряда 2 3 5 6 7 медиана равна 5, а для ряда 2 3 5 6 7 9 медиана равна 5,5 .

Размахом варьирования называется разность между наибольшей и наименьшей вариантами. Например, для ряда 1 3 4 5 6 10 размах равен 9.

Средним абсолютным отклонением называется среднее арифметическое абсолютных отклонений:

.

Среднее абсолютное отклонение служит для характеристики рассеяния вариационного ряда.

Коэффициентом вариации называется выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации – безразмерная величина, поэтому он пригоден для сравнения рассеяний рядов, варианты которых имеют различную размерность, например, если варианты одного ряда выражены в метрах, а другого – в граммах.


Сейчас читают про: