Эмпирической функцией распределения (функцией распределения выборки) называют функцию Fn(x), определяющую для каждого значения х относительную частоту события x<х, т.е. Fn(x)=nx/n, где nx – число вариант меньших х, n – объем выборки.
Из определения следует, что эмпирическая функция
Из определения эмпирической функции распределения следует, что она обладает всеми свойствами функции распределения:
1. 0£Fn(x)£1.
2. Fn(x) - неубывающая функция.
3. Если х1 – наименьшая варианта, а хк – наибольшая варианта, то Fn(x)=0 при x£x1, и Fn(x)=1 при х>xк.
Теорема 7.2.1. (Гливенко – Кантелли).
Эмпирическая функция распределения Fn(x) сходится по вероятности к теоретической функции распределения F(x), т.е. для любого хÎR и для любого e>0
P(½Fn(x)–F(x)½<e)=1.
Доказательство. Доказательство теоремы Гливенко-Кантелли является довольно сложным, поэтому докажем следующий её упрощенный вариант. «При любом ε>0 верно
для любого х». По определению Fn(xk)=, где nx число вариант меньших хk. Рассмотрим наблюдения как n независимых испытаний Бернулли, в каждом из которых возможны два исхода: или . Вероятности этих событий соответственно равны p=P(x<xk)=Fx(xk) и q=P(x³xk)=1-Fx(xk). Событие {w:x<xk} будем называть успехом, а nx - число успехов в n независимых испытаниях Бернулли. Тогда математическое ожидание равно Мnx=np, и дисперсия равна Dnx=npq. Отсюда получим
|
|
.
В силу неравенства Чебышева для любого фиксированного e>0 верна оценка
P(½Fn(x)–F(x)½³e)£,
поэтому P(½Fn(x)–F(x)½³e)£®0 при n®µ,
откуда следует утверждение теоремы, что при n®¥ Fn(x)F(x).
Смысл теоремы Гливенко-Кантелли заключается в том, что при увеличении объема выборки у эмпирической функции распределения исчезают свойства случайности, и она приближается к теоретической функции распределения.
Эмпирическая функция распределения служит оценкой функции распределения генеральной совокупности.
График эмпирической функции распределения есть неубывающая ступенчатая кривая со скачками равными 1/n в точках вариационного ряда. Если m точек вариационного ряда совпадают и равны xi, то скачок в точке xi равен m/n.
Например, задана таблица наблюдений за значениями случайной величины x:
xi | ||||
ni | ||||
wi | 0,75 | 0,2 | 0,05 |
Эмпирическая функция распределения имеет вид:
Рис.7.2.1.
Задача Пусть х1,х2,...,хn - выборка независимых наблюдений из непрерывной генеральной совокупности с функцией распределения F(x) и плотностью распределения f(x). Найти функции распределения и плотности распределения крайних членов вариационного ряда: xmin и xmax.
Решение. Из определения функции распределения следует, что
|
|
Тогда
Аналогично,
Отсюда получаем функцию плотности