Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:
.
Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии.
Несмещенная оценка дисперсии определяется по формуле:
.
Характеристики генеральной совокупности | Формулы оценивания |
Среднее, m | |
Дисперсия, |
[ii] Выборочная ковариация
Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Выборочная ковариация между x и y определяется как
[iii] Коэффициент корреляции
Коэффициент корреляции является более точной мерой зависимости между величинами. Подобно дисперсии и ковариации коэффициент корреляции имеет две формы – теоретическую и выборочную.
Для двух переменных x и y теоретический коэффициент корреляции определяется следующим образом:
.
выборочный коэффициент корреляции определяется по формуле:
.
[iv] Риск портфеля трехфакторной модели s2p = V p = XT*COV*X
[v] Оценка параметров регрессионной модели.
|
|
Для оценки параметров регрессионного уравнениянаиболее часто используют метод наименьших квадратов (МНК), согласно которому в качестве оценки принимают вектор a, который минимизирует сумму квадратов отклонения наблюдаемых значений у; от модельных значений, т. е. квадратичную форму:
Þ min.
Формула для вычисления параметров регрессионного уравнения имеет вид:
a = (Xт X)-1 X т Y
Рассмотрим случай зависимости переменной Y от одного фактора Х.
Мы хотим подобрать уравнение
.
для вычисления а1 можно использовать следующие выражения:
а1 = =
а0 =
Вычисление параметров рыночной модели mi = ai + bi ´mf
с помощью МНК:
= =
[vi] Дисперсионный анализ модели регрессии.
После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - и;
(*)
Величина, — расчетное значение у в наблюдении i — это то значение, которое имел бы у при условии, что уравнение регрессии было правильным, и отсутствии случайного фактора. Это, иными словами, величина у, спрогнозированная по значению х в данном наблюдении. Тогда остаток, есть расхождение между фактическим и спрогнозированным значениями величины y. Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.
Используя (*) разложим дисперсию у:
(**)
Это означает, что мы можем разложить Var (у) на две части: — часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть.
используя определение выборочной дисперсии и умножив на n обе части уравнения (**), можно представить его следующим образом:
(***)
|
|
где - значения y, вычисленные по модели;
Se2 = =- остаточная сумма квадратов отклонений;
Sy2 =- общая сумма квадратов отклонений зависимой переменной от ее среднего значения,
- сумма квадратов отклонений, объясненная регрессией.
[vii] коэффициент детерминации - R2 .
Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2, или , рассчитывается так:
, где
n — число наблюдений;
k — число независимых переменных.