Выборочная дисперсия

Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

.

Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии.

Несмещенная оценка дисперсии определяется по формуле:

.

Характеристики генеральной совокупности Формулы оценивания
Среднее, m
Дисперсия,

[ii] Выборочная ковариация

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Выборочная ковариация между x и y определяется как

[iii] Коэффициент корреляции

Коэффициент корреляции является более точной мерой зависимости между величинами. Подобно дисперсии и ковариации коэффициент корреляции имеет две формы – теоретическую и выборочную.

Для двух переменных x и y теоретический коэффициент корреляции определяется следующим образом:

.

выборочный коэффициент корреляции определяется по формуле:

.

[iv] Риск портфеля трехфакторной модели s2p = V p = XT*COV*X

[v] Оценка параметров регрессионной модели.

Для оценки параметров регрессионного уравнениянаиболее часто используют метод наименьших квадратов (МНК), согласно которому в качестве оценки принимают вектор a, который минимизирует сумму квадратов отклонения наблюдаемых значений у; от модельных значений, т. е. квадратичную форму:

Þ min.

Формула для вычисления параметров регрессионного уравнения имеет вид:

a = (Xт X)-1 X т Y

Рассмотрим случай зависимости переменной Y от одного фактора Х.

Мы хотим подобрать уравнение

.

для вычисления а1 можно использовать следующие выражения:

а1 = =

а0 =

Вычисление параметров рыночной модели mi = ai + bi ´mf

с помощью МНК:

= =

[vi] Дисперсионный анализ модели регрессии.

После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - и;

(*)

Величина, — расчетное значение у в наблюдении i — это то значение, кото­рое имел бы у при условии, что уравнение регрессии было правильным, и от­сутствии случайного фактора. Это, иными словами, величина у, спрогнозированная по значению х в данном наблюдении. Тогда остаток, есть расхождение между фактическим и спрогнозированным значениями величины y. Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.

Используя (*) разложим дисперсию у:

(**)

Это означает, что мы можем разложить Var (у) на две части: часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть.

используя определение выборочной дисперсии и умножив на n обе части уравнения (**), можно представить его следующим образом:

(***)

где - значения y, вычисленные по модели;

Se2 = =- остаточная сумма квадратов отклонений;

Sy2 =- общая сумма квадратов отклонений зависимой переменной от ее среднего значения,

- сумма квадратов отклонений, объясненная регрессией.

[vii] коэффициент детерминации - R2 .

Он показывает долю вариации результативного признака, находя­щегося под воздействием изучаемых факторов, т. е. определяет, ка­кая доля вариации признака Y учтена в модели и обусловлена влия­нием на него факторов.

В многофакторной регрессии добавление дополнительных объ­ясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скор­ректирован с учетом числа независимых переменных. Скоррек­тированный R2, или , рассчитывается так:

, где

n — число наблюдений;

k — число независимых переменных.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow