Эмпирическая функция распределения

Эмпирической функцией распределения (функцией распределения выборки) называют функцию Fn(x), определяющую для каждого значения х относительную частоту события x<х, т.е. Fn(x)=nx/n, где nx – число вариант меньших х, n – объем выборки.

Из определения следует, что эмпирическая функция

Из определения эмпирической функции распределения следует, что она обладает всеми свойствами функции распределения:

1. 0£Fn(x)£1.

2. Fn(x) - неубывающая функция.

3. Если х1 – наименьшая варианта, а хк – наибольшая варианта, то Fn(x)=0 при x£x1, и Fn(x)=1 при х>xк.

Теорема 7.2.1. (Гливенко – Кантелли).

Эмпирическая функция распределения Fn(x) сходится по вероятности к теоретической функции распределения F(x), т.е. для любого хÎR и для любого e>0

P(½Fn(x)–F(x)½<e)=1.

Доказательство. Доказательство теоремы Гливенко-Кантелли является довольно сложным, поэтому докажем следующий её упрощенный вариант. «При любом ε>0 верно

для любого х». По определению Fn(xk)=, где nx число вариант меньших хk. Рассмотрим наблюдения как n независимых испытаний Бернулли, в каждом из которых возможны два исхода: или . Вероятности этих событий соответственно равны p=P(x<xk)=Fx(xk) и q=P(x³xk)=1-Fx(xk). Событие {w:x<xk} будем называть успехом, а nx - число успехов в n независимых испытаниях Бернулли. Тогда математическое ожидание равно Мnx=np, и дисперсия равна Dnx=npq. Отсюда получим

.

В силу неравенства Чебышева для любого фиксированного e>0 верна оценка

P(½Fn(x)–F(x)½³e)£,

поэтому P(½Fn(x)–F(x)½³e)£®0 при n®µ,

откуда следует утверждение теоремы, что при n®¥ Fn(x)F(x).

Смысл теоремы Гливенко-Кантелли заключается в том, что при увеличении объема выборки у эмпирической функции распределения исчезают свойства случайности, и она приближается к теоретической функции распределения.
Эмпирическая функция распределения служит оценкой функции распределения генеральной совокупности.

График эмпирической функции распределения есть неубывающая ступенчатая кривая со скачками равными 1/n в точках вариационного ряда. Если m точек вариационного ряда совпадают и равны xi, то скачок в точке xi равен m/n.

Например, задана таблица наблюдений за значениями случайной величины x:

xi        
ni        
wi 0,75 0,2 0,05

Эмпирическая функция распределения имеет вид:


Рис.7.2.1.

Задача Пусть х12,...,хn - выборка независимых наблюдений из непрерывной генеральной совокупности с функцией распределения F(x) и плотностью распределения f(x). Найти функции распределения и плотности распределения крайних членов вариационного ряда: xmin и xmax.

Решение. Из определения функции распределения следует, что

Тогда

Аналогично,

Отсюда получаем функцию плотности



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: