Интервальные оценки для генеральной средней (математического ожидания)

Интервальные оценки параметров распределения

 

При выборке небольшого объёма точечная оценка может существенно отличаться от истинного значения параметра, то есть приводить к грубым ошибкам. Поэтому в случае малой выборки часто используют интервальные оценки.  

Интервальной оценкой называют числовой доверительный интервал , определяемый по результатам выборки, относительно которого можно утверждать с определённой, близкой к единице вероятностью , что он заключает в себе значение оцениваемого параметра генеральной совокупности, то есть , где и называют также нижней и верхней границами доверительного интервала параметра θ.

Вероятность γ = 1 – α принято называть доверительной вероятностью (надёжностью) оценки параметра θ. Выбор значения доверительной вероятности следует производить исходя из требуемого в конкретной задаче уровня значимости α.

Чтобы получить представление о точности и надёжности оценки параметра θ, можно для каждой близкой к единице вероятности γ указать такое значение δ, что .

Оценка будет тем точнее, чем меньше для заданной доверительной вероятности γ будет δ. Нижняя граница доверительного интервала: , верхняя граница доверительного интервала: , величина доверительного интервала .

Из указанного соотношения следует, что вероятность того, что доверительный интервал со случайными границами накроет неизвестный параметр θ, равна γ. Величину δ, равную половине величины h доверительного интервала называют точностью оценки: .

В общем случае границы доверительного интервала и есть некоторые функции от результатов наблюдений X1, X2,..., Xn. Вследствие случайного характера выборки при многократном её повторении будут изменяться как положение, так и величина доверительного интервала.

Рассмотрим теперь правила построения доверительных интервалов для некоторых параметров распределений.

 

 

Интервальные оценки для генеральной средней (математического ожидания)

Правила построения доверительного интервала для математического ожидания зависит от того, известна или не известна дисперсия генеральной совокупности σ2.

Пусть из генеральной совокупности X с нормальным законом распределения N(μ; σ) и известным генеральным средним квадратическим отклонением σ взята случайная выборка X1, X2,..., Xn объёмом n и вычислено . Требуется найти интервальную оценку для математического ожидания μ. Используем среднюю арифметическую , которая имеет нормальное распределение с параметрами .

Тогда статистическая оценка имеет нормированное нормальное распределение с параметрами N(0;1). Вероятность любого отклонения может быть вычислена по интегральной теореме Лапласа для интервала, симметричного относительно μ, по формуле:

Задавая определённую доверительную вероятность γ по таблице интегральной функции вероятностей Ф(t), можно определить значение tγ. Для оценки математического ожидания преобразуем предыдущую формулу:

и далее будем иметь:

Интервал, определённый по этой формуле, и представляет собой доверительный интервал для математического ожидания μ, причём            tγ= Ф-1(γ).

Точность оценки генеральной средней (предельная ошибка выборки) равна:

где σх – средняя квадратическая (стандартная) ошибка выборки, которая рассчитывается:

а) в случае повторной выборки:

б) в случае бесповторной выборки: .

Эта формула в практических приложениях занимает особое место. По этой формуле можно, например, вычислить объём случайной выборки n, необходимый для оценки нормальной средней с заданной надёжностью γ и точностью δ, а также при заданной точности δ и известном объёме выборки n можно определить надёжность (доверительную вероятность) γ.

Нижняя и верхняя границы доверительного интервала равны:

Ширина доверительного интервала равна h = μmax – μmin = 2δ. 

Доверительная вероятность попадания генеральной средней в интервал, симметричный относительно точечной оценки математического ожидания (выборочной средней) определяется следующим образом:

Доверительная вероятность попадания генеральной средней μ в интервал (μ1; μ2) вычисляется с помощью интегральной функции Лапласа:

где и .

Предположим теперь, что генеральная совокупность X распределена по нормальному закону N(μ; σ) с неизвестным средним квадратическим отклонением σ.

В этом случае для построения интервальной оценки генеральной средней μ используется статистическая оценка , имеющая распределение Стьюдента с числом степеней свободы k = n – 1.

Предполагается, что средняя арифметическая и выборочное среднее квадратическое отклонение S определены по результатам выборки объёмом n из генеральной совокупности X.

По таблице t-распределения Стьюдента для k = n – 1 степеней свободы находим значение tα,k, для которого справедливо равенство:

где точность оценки генеральной средней равна:

При достаточно больших n различие между доверительными интервалами при известной и неизвестной дисперсии, мало, так как при         n → ∞ распределение Стьюдента стремится к нормальному распределению.

Пример 1. По результатам n = 10 наблюдений установлено, что средний темп роста акций предприятий отрасли равен = 104,4%. В предположении, что ошибки наблюдений распределены по нормальному закону со средним квадратическим отклонением σ = 1%, определить с надёжностью γ = 0,95 интервальную оценку для генеральной средней μ.

Решение. Интервальную оценку будем искать при условии известного параметр σ. По таблице интегральной функции Лапласа Ф(t) из условия γ = 0,95 найдем tγ = 1,96.

Тогда точность оценки равна:

Отсюда доверительный интервал имеет вид:

104,4 – 0,62 ≤ μ ≤ 104,4 + 0,62

и окончательно 103,78 ≤ μ ≤ 105,02 (%).

Найдём доверительную вероятность, с которой можно утверждать, что средний темп роста акций окажется в пределах от 104% до 106%.

Определим значения t1 и t2 для нормального распределения:

Тогда .

Пример 2. Средняя урожайность пшеницы на 17 опытных участках области составила = 25 ц/га, а S = 2 ц/га. Найти с надёжностью 0,9 границы доверительного интервала для оценки генеральной средней.

Решение. В данном случае генеральное среднее квадратическое отклонение σ неизвестно.

Из таблиц t-распределения для числа степеней свободы k = n – 1 =          = 17 – 1 = 16 и α = 1 – γ = 1 – 0,9 = 0,1 найдём tα =1,746.

Тогда точность оценки равна:

Отсюда доверительный интервал равен:

25 – 0,873 ≤ μ ≤ 25 + 0,873

и окончательно 24,127 ≤ μ ≤ 25,873 (ц/га).

Найдём доверительную вероятность, с которой урожайность пшеницы окажется в интервале от 23,94 до 26,06 ц/га. Этот интервал симметричен относительно выборочной средней = 25 ц/га с точностью оценки δ = 1,06. Тогда коэффициент доверия по распределению Стьюдента составит:

 

Отсюда γ = 1 – α = 1 – St(tα; k = n – 1) = 1 – St(2,12; 16) = 1 – 0,05 = 0,95.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: