Точность оценки, доверительная вероятность и доверительный интервал

Б. НСВ

Пусть X - НСВ, которая в результате n испытаний приняла значения х₁, х₂,..., х_n. Допустим, что вид плотности распределения f(х) задан, но не известен параметр Θ, которым определяется эта функция.

Функцией правдоподобия НСВ X называют функцию аргумента Θ:

L (х₁, х₂,..., х_n; Θ) = f(х₁; Θ) f(х₂; Θ)... f(х„; Θ).

Оценку наибольшего правдоподобия неизвестного параметра распределения НСВ ищут так же, как в случае ДСВ.

Если плотность распределения f(х) НСВ X определяется двумя неизвестными параметрами Θ₁ и Θ₂, то функция правдоподобия является функцией двух независимых аргументов Θ₁ и Θ₂:

L = f(х₁, Θ₁, Θ₂) f(х₂, Θ₁, Θ₂,)... f(х_n, Θ₁, Θ₂).

Далее находят логарифмическую функцию правдоподобия и для отыскания ее максимума составляют и решают систему:

Система [ ∂lnL/∂ Θ₁=0 и ∂lnL/∂ Θ₂=0]

Пример. Реш-е: составим ф-ци правдоподобия: L=p(x₁,θ)*…*p(x_n,θ)

Учитывая, что θ=pu; получим, что

Напишем логарифмическую ф-цию правдоподобия:

Найдем первую производную по р =>

(1-р)Σхi=(nm-Σxi)p

Σхi=nmp; р= Σхi/nm

Найдем вторую произвожную по р => р= Σхi/nm – точка max=> ее надо принять в кач-ве оценки наиб.правдоподобия неизв.вер-ть р биномиального распределения.

р*= Σхi/nm. Очевидно, что если xi- появление события наблюдалось в ni опытах, то р*= Σхi*ni/nm

30. Точность оценки, доверительная вероятность и доверительный интервал. Доверительный интервал для оценки математического ожидания нормального распределения при известном и неизвестном СКО.

Точность оценки, доверительная вероятность (надежность). Доверительный интервал

Допустим получена оценка θ* неизвестного параметра θ, возникает вопрос с какой абсолютной ошибкой получена эта оценка.

Очевидно, что оценка θ* тем точнее определяет неизвестный параметр θ, чем меньше ε>0 в неравенстве |θ- θ*|<ε (1)

Т.О. точностью оценки называют число ε>0 оценивающие сверху абсолютную величину разности не известного параметра и его оценки.

Т.К. θ* является СВ и статистические методы не позволяют утверждать, что неравенство (1) осуществляется всегда, то можно говорить только о вероятности его выполнения.

Опр.: надёжность (доверительную вероятность) оценки θ и θ* назыв.вер-ть γ с которой выполнятеся неравенство (1)

Обычно надёжность оценки задаётся заранее, величиной близкой к единице, например 0,9; 0.95; 0,99; 0,999 и т.д.

Пусть вероятность того, что выполнится неравенство (1) равно γ: Р(|θ- θ*|< ε)= γ

Тогда из того, что |θ-θ*|<ε ó -ε<|θ- θ*|< ε ó θ*-ε<|θ|<θ*+ε, получим равенство:

Р(θ*-ε<|θ|<θ*+ε)= γ, кот.следует понимать так: вер-ть того, что неизвестный параметр заключается в интервале: (θ*-ε;θ*+ε), т.е θ=θ*±ε= γ этот интервал назв.доверительным интервалом.

Доверительный интервал для оценки математического ожидания нормального распределения при известном СКО.

Пусть количественный признак X генеральной совокупности распределен нормально с известным СКО.

Нужно найти доверительный интервал, покрывающие с надёжностью γ МО а этого распределения при известной выборочной средней х’.

Выборочную среднюю х’ рассматриваем как СВ (х’ меняется от выборки к выборке), а выборочные значения х₁, х₂, …, х_n явл.одинаково распространенными (по нормальному закону) СВ с параметрами а и σ, выборочная средняя х’ так же распределена нормально с параметрами а и σ/(n)^1/2, тогда имеем, что вероятность того, что Р(|х’-a|<ε)=2Ф(ε/(σ/(n)^1/2)), вероятность равна заданной надёжностью, т.е Р(|х’-a|< ε)= γ

Обозначим ε/(σ/(n)^1/2)=t_γ, тогда 2Ф(t_γ)=γ |=> Ф(t_γ)=γ/2.

Значение t_γ находят по известному значению γ/2 по таблице ф-ции Лапласа.

По найденному значению t_γиз (1) определяют точность оценки: ε= (t_γσ)/(n)^1/2 и доверительный интервал для МО х’-ε<a< х’+ε с надёхностью γ.

Пример 1. Реш-е: Оценкой генер.СКО σ служит исправленная СКО σ=S=√[n/(n-1)] σ_В= 3,21

Ф(t_γ)= γ/2= 0,495. По таблице находим, что t_γ=2,573

ε= (t_γσ)/√(n)=0,653 |=> доверит.интервал: 11,62-0,65<a<11,62+0,65; 10,97<а<12,27

Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном СКО.

При неизвестном СКО генеральной совокупности нельзя воспользоваться ф-цией Лапласа, в этом случае для нахождения доверительного интервала по данным выборки строится СВ(с возможными значениями t): T= (х’-a)/(σ/(n)^1/2), которое имеет распределение, называемое распределением Стьюдента.

Доказано, что плотность вероятности распределения Стьюдента S(t;n) не зависит от неизвестных параметров a и S, а определяется только объёмом выборки n.

Плотность распределения Стьюдента – чётная относительно t, поэтому имеем, что: Р(|((х’-a)(n)^1/2)/s)|<t_γ= 2∫S(t;n)dt=γ

Для определения t_γ по заданной надёжности γ и объёму выборки n составлена таблица t(γ;n).

При увеличении объёма выборки распределения Стьюдента быстро приближается к нормальному (с нормальными параметрами а=0 и σ=1), поэтому при n≥30 можно пользоваться ф-цией Лапласа |=> Решение поставленной задачи выполняется след.образом: по заданной надёжности γ и объёму выборки n по таблице ф-ции t(γ;n) наход.значения t_γ. Далее находится точность оценки по формуле аналогичной формуле ε= (t_γσ)/(n)^1/2, где S=[n/(n-1)]^1/2σ_B

Доверительный интервал для оценки МО с заданной надёжностью определяется неравенством х’-ε<a< х’+ε.

Пример 2. Реш-е: Результат измерения зависит от очень большого числа случайных причин, действующих независимо др.от друга. Поэтому считаем его распределение по закону близкого к нормальному. При γ=0,99 и n=9 по табл. t(γ;n)=3,36, вычислим S=√[n/(n-1)] σ_В=4,56; ε= (t_γσ)/√(n)=5,11

Доверит.интервал для истинного значения измеряемой величины имеет вид: 32,86-5,11<a<32,86+5,11; 27,75<a<37,97