Вероятностное моделирование ошибок

Мы уже неоднократно сталкивались с вопросом о том, сколь существенно величина коэффициента корреляции (детерминации) должна отличаться от нуля, чтобы можно было говорить о действительно существующей линейной связи между исследуемыми переменными.

Если оцененное значение эластичности потребления некоторого товара оказалось несколько больше единицы, то возникает вопрос о том, сколь надежным является заключение о том, что потребление этого товара эластично по ценам.

Если мы будем использовать подобранную прямую

для прогнозирования значений  для новых наблюдений , t= n +1,..., n + k, то сколь надежными будут такие прогнозы?

Если у нас нет теоретических (экономических) оснований для выбора между моделью в уровнях переменных и моделью в логарифмах уровней, то как выбрать одну из этих моделей на основании одних только наблюдений?

Ответы на эти и другие подобные вопросы невозможны, если мы не сделаем некоторых более или менее подробных предположений о структуре последовательности ошибок , участвующих в определении модели наблюдений

Базовая, и наиболее простая модель для последовательности  предполагает, что  — независимые случайные величины, имеющие одинаковое распределение (i. i. d. — independent, identically distributed random variables).

Для нас (пока!) достаточно представлять случайную величину   как переменную величину, такую, что до наблюдения ее значения невозможно предсказать это значение абсолютно точно, и, в то же время, для любого , , определена вероятность

того, что наблюдаемое значение переменной   не превзойдет ; . Функция  , называется функцией распределения случайной величины   (c. d. f. — cumulative distribution function).

Говоря об ошибках   как о случайных величинах, мы, соответственно, понимаем указанную линейную модель наблюдений таким образом, что

а) существует (теоретическая, объективная или в виде тенденции) линейная зависимость значений переменной  от значений переменной   с вполне определенными, хотя обычно и не известными исследователю, значениями параметров   и ;

б) эта линейная связь для реальных статистических данных не является строгой: наблюдаемые значения  переменной   отклоняются от значений , указываемых моделью линейной связи

в) при заданных (известных) значениях   конкретные значения отклонений

не могут быть точно предсказаны до наблюдения значений  даже если значения параметров   и   известны точно;

г) для каждого , определена вероятность   того, что наблюдаемое значение отклонения   не превзойдет , причем эта вероятность не зависит от номера наблюдения;

д) вероятность того, что наблюдаемое значение отклонения  в i- м наблюдениине превзойдет , не зависит от того, какие именно значения принимают отклонения в остальных   наблюдениях.

В дальнейшем, говоря о той или иной случайной величине , мы будем предполагать существование функции , принимающей только неотрицательные значения и такой, что

1) площадь под кривой

в прямоугольной системе координат  (точнее, площадь, ограниченная сверху этой кривой и снизу — горизонтальной осью ) равна ,

2) для любой пары значений   с , вероятность

численно равна площади, ограниченной снизу осью , сверху — кривой , слева — вертикальной прямой , справа — вертикальной прямой  (т. е. равна части площади под кривой , расположенной между точками   и ).

3) для любого , вероятность  того, что наблюдаемое значение   не превзойдет , равна площади, ограниченной снизу осью , сверху — кривой  и справа — вертикальной прямой , т. е. равна части площади под кривой , расположенной левее точки .

Заметим, что при этом выполняется следующее важное соотношение:

(Действительно, вероятность  численно равна части площади под кривой , расположенной левее точки , а эта часть складывается из части площади под кривой, расположенной левее точки  и части площади под кривой, расположенной между точками   и , так что

откуда и следует заявленное соотношение.) Кроме того,

(Действительно,

поскольку слева складываются части площади под кривой , расположенные, соответственно, левее и правее точки , так что в сумме они составляют всю площадь под этой кривой, а вся площадь под кривой  как раз и равна 1.)

Функция  связана с функцией распределения случайной величины   соотношениями

и называется функцией плотности вероятности случайной величины   (p.d.f. — probability density function). Для краткости, мы часто будем говорить о функции  как о функции плотности или о плотности распределения случайной величины .

Возьмем два непересекающихся интервала значений переменной :  и . Рассмотрим два варианта распределения вероятности случайной величины : равномерное распределение на отрезке  и треугольное распределение на том же отрезке. Графики функций плотности для этих двух вариантов имеют следующий вид:

Площади заштрихованных прямоугольников на первом графике численно равны вероятностям того, что случайная величина , имеющая равномерное распределение на отрезке , примет значения в пределах  и , соответственно. Поскольку основания и высоты этих прямоугольников равны, то равны и их площади, т.е. равны указанные вероятности.

Площади заштрихованных трапеций на втором графике численно равны вероятностям того, что случайная величина , имеющая треугольное распределение на отрезке , примет значения в пределах  и , соответственно. Высоты этих трапеций равны, однако стороны трапеции, расположенной правее, больше сторон трапеции, расположенной левее. Поэтому и площадь трапеции, расположенной правее, больше площади трапеции, расположенной левее. А это означает, в свою очередь, что вероятность того, что случайная величина , имеющая треугольное распределение на отрезке , примет значения в пределах , больше вероятности того, что эта случайная величина   примет значения в пределах .

Таким образом, функция плотности указывает на более вероятные и менее вероятные интервалы значений случайной величины. Если случайная величина   имеет равномерное распределение на отрезке , то для нее все интервалы значений, имеющие одинаковую длину и расположенные целиком в пределах отрезка , имеют одинаковые вероятности (т. е. вероятности попадания значений случайной величины на эти интервалы одинаковы). Если же случайная величина   имеет треугольное распределение на отрезке , то для нее интервалы значений, имеющие одинаковую длину и расположенные целиком в пределах отрезка , имеют, вообще говоря, различные вероятности: вероятность того, что случайная величина примет значение в интервале, расположенном ближе к центральному значению , больше вероятности того, что случайная величина примет значение в интервале, расположенном ближе к одному из концов отрезка .

Обсудим несколько более точно вопрос о том, что мы понимаем под независимостью нескольких случайных величин. Пусть мы имеем   случайных величин , имеющих одинаковую функцию распределения . Мы говорим, что эти случайные величины независимы в совокупности, если для любого набора пар , ,..., , где   и   могут быть равны также  и ,

При таком предположении условная вероятность того, что, например, , при условии, что , , , равна безусловной вероятности того, что , т. е. вероятности, вычисляемой без задания указанногоусловия:

(Вертикальная черта в этой формуле указывает на то, что первая вероятность — условная; справа от вертикальной черты записано условие, при котором вычисляется эта вероятность.) Иначе говоря, на распределение вероятности случайной величины   не влияет информация о значениях случайных величин . И вообще, на распределение вероятностей случайной величины   не влияет информация о значениях случайных величин  с .

Если случайные величины  имеют одинаковое распределение  (заданное или функцией распределения или функцией плотности) и независимы в совокупности, то часто это обозначают в записи следующим образом:

~ .

Возвращаясь к модели наблюдений

и предполагая, что  — независимые случайные величины, имеющие одинаковое распределение (i. i. d), мы должны теперь сделать еще и предположение о том, каким именно является это одинаковое для всех   распределение.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: