Выборочные значения (оценки) ковариации и коэффициента корреляции и их вычисление в Excel

В эконометрике корреляционный анализ применяется для отбора факторов, оказывающих наибольшее влияние на исследуемый показатель и оценки качества построенных эконометрических моделей.

Если имеются две выборки x =(x ₁,…, x_I) и y =(y ₁,…, y_I), то можно рассчитать выборочные значения ковариации и корреляции. Ковариация c рассчитывается по формуле

а коэффициент корреляции r по формуле

В более общем случае, когда имеется матрица данных X, размерностью I наблюдений на J переменных, то выборочная матрица ковариаций C _I между наблюдениями рассчитывается так –

C _I = XX ^t.

Выборочная матрица ковариаций C _J между переменными так –

C _J = X ^t X.

Для вычисления парных ковариаций в Excel используют следующие стандартные функции: COVAR (КОВАР), CORREL (КОРРЕЛ).

COVAR (x, y)

Возвращает выборочную ковариацию между выборками x и y.

CORREL (x, y)

Возвращает выборочный коэффициент корреляции между выборками x и y.

Понятие статистической процедуры оценивания параметров эконометрической модели. Линейные статистические процедуры. Требования к наилучшей статистической процедуре: несмещённость и минимальные дисперсии оценок параметров.

Оценкой вn параметра называют всякую функцию результатов наблюдений над случайной величиной X (иначе — статистику), с помощью которой судят о значениях параметра a.

Статистические проверки параметров регрессии основаны на непроверяемых предпосылках распределения случайной величины. Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям: быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.

В отличие от параметра, его оценка г n — величина случайная. «Наилучшая оценка» r n должна обладать наименьшим рассеянием относительно оцениваемого параметра a, например, наименьшей величиной математического ожидания квадрата отклонения оценки от оцениваемого параметра М(r - a)2.

Оценка в n параметра a называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т. е. М(r) = a.

В противном случае оценка называется смещенной.

Если это равенство не выполняется, то оценка г, полученная по разным выборкам, будет в среднем либо завышать значение a (если М(r) > a, либо занижать его (если М(r) < 0). Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

Оценка в n параметра a называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:

В случае использования состоятельных оценок оправдывается увеличение объема выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки.
Несмещенная оценка r n параметра a называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра a, вычисленных по выборкам одного и того же объема n.
Так как для несмещенной оценки M(r n - a)2есть ее дисперсия , то эффективность является решающим свойством, определяющим качество оценки.
Для нахождения оценок параметров (характеристик) генеральной совокупности используется ряд методов.
Указанные критерии оценок (несмещенность, состоятельность, эффективность) обязательно учитываются при разных способах оценивания.