Существует много ситуаций, в которых вариация данных важна не менее, чем средняя величина. Когда мы оцениваем портфель инвестиций, то исходим из ожидаемой прибыли, но, в то же время нельзя сбрасывать со счетов риск инвестирования. Такой риск может быть оценен на основе дисперсии возможной прибыли инвестиций (см. раздел 3.3). Предположим, что у нас имеются две независимые выборки и мы хотим знать, взяты ли они из нормальных генеральных совокупностей с одинаковой дисперсией. Например, предположим, что компания производит определенный элемент на двух автономных производственных линиях — А и В. Характеристики обеих линий одинаковые. Как определить, одинакова ли вариация продукции на этих линиях? Ответ на этот вопрос можно получить сравнив дисперсии случайных выборок, взятых из продукции первой и второй линий, используя соответствующую процедуру испытания гипотез. Так же можно сравнить риск двух различных инвестиционных портфелей. Сравнение дисперсий фактической прибыли, полученной в прошлые годы, даст возможность принять решение.
|
|
Отношение дисперсий или F-критерий
В разделе 4.4. было показано, что отношение двух дисперсий подчиняется распределению F-статистики:
168 Ч. 2. Анализ данных как составная часть принятия решений
F = —
Поскольку лучшая оценка дисперсии генеральной совокупности вычисляется по формуле:
12 _ п. 2
<Г» - S,
П - 1
ТО
п, s? (п2 - 1) *(п,-1) п24 '
Нулевая гипотеза предполагает, что две выборки независимы и взяты из нормальных генеральных совокупностей с одинаковыми дисперсиями, cq = а^. В этом случае F равно 1. Из теории испытания гипотез мы знаем, что если даже нулевая гипотеза верна, то маловероятно, что <з\ имеет точно такое же значение, что и о~2 из-за колебаний отбора. Следовательно, маловероятно, что F-статистика будет равна 1. Решением, которое мы собираемся принять, используя испытание гипотез, является то, будет ли истинная величина F достаточно близка к 1 для того, чтобы подтвердить вероятность, что выборочные совокупности были взяты из нормальных генеральных совокупностей с одинаковой дисперсией. В этом
случае различие в значениях щ и oj может быть отнесено к случайностям.
Как отмечалось в разделе 4.4.4, F-распределение зависит от числа степеней свободы в обеих сравниваемых выборках. Когда мы производим оценку единственного генерального параметра по выборке, то теряем одну степень свободы. Таким образом, для каждой выборки остаются (а 1) степени свободы.
Для того, чтобы привести стандартную таблицу для F-распределения к более удобному виду, даны только значения F £ 1, то есть это — таблицы с одной границей. Чтобы использовать эти таблицы при расчете F, делим большую дисперсию на меньшую. Проверочной статистикой является:
|
|
F т (большая оцененная дисперсия) / (меньшая оцененная дисперсия).
□ Пример 6.8. Биржевой маклер исследует две инвестиции — А н В — от имени клиента. Инвестиция А предполагается на срок 10 лет с ожидаемой ежегодной прибылью в течение этого периода 17,8%. Инвестиция В рассчитана на срок 8 лет также с ожидаемой готовой прибылью 17,8%. Дисперсии ежегодных прибылей от двух инвестиций составляют 3,21%2 и 7,14%3. Есть ли какое-либо основание считать, что риски инвестиций А и В неравны? Предполагается, что распределения ежегодных прибылей на инвестиции подчиняются нормальному распределению.
Гл. 6. Статистический вывод 2: испытание гипотез ____________ 169