Выборочные значения (оценки) ковариации и коэффициента корреляции и их вычисление в Excel

В эконометрике корреляционный анализ применяется для отбора факторов, оказывающих наибольшее влияние на исследуемый показатель и оценки качества построенных эконометрических моделей.

Если имеются две выборки x =(x 1,…, xI) и y =(y 1,…, yI), то можно рассчитать выборочные значения ковариации и корреляции. Ковариация c рассчитывается по формуле

,

а коэффициент корреляции r по формуле

.

В более общем случае, когда имеется матрица данных X, размерностью I наблюдений на J переменных, то выборочная матрица ковариаций C I между наблюдениями рассчитывается так –

C I = XX t .

Выборочная матрица ковариаций C J между переменными так –

C J = X t X.

Для вычисления парных ковариаций в Excel используют следующие стандартные функции: COVAR (КОВАР), CORREL (КОРРЕЛ).

COVAR (x, y)

Возвращает выборочную ковариацию между выборками x и y.

CORREL (x, y)

Возвращает выборочный коэффициент корреляции между выборками x и y.

Понятие статистической процедуры оценивания параметров эконометрической модели. Линейные статистические процедуры. Требования к наилучшей статистической процедуре: несмещённость и минимальные дисперсии оценок параметров.

Оценкой вn параметра называют всякую функцию результатов наблюдений над случайной величиной X (иначе — статистику), с помощью которой судят о значениях параметра a.

Статистические проверки параметров регрессии основаны на непроверяемых предпосылках распределения случайной величины. Они носят лишь предвари­тельный характер. После построения уравнения регрессии про­водится проверка наличия у оценок тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критери­ям: быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важ­ное практическое значение в использовании результатов регрес­сии и корреляции.

В отличие от параметра, его оценка г n — величина случай­ная. «Наилучшая оценка» r n должна обладать наименьшим рас­сеянием относительно оцениваемого параметра a, например, наи­меньшей величиной математического ожидания квадрата отклонения оценки от оцениваемого параметра М(r - a)2.

Оценка в n параметра a называется несмещенной, если ее мате­матическое ожидание равно оцениваемому параметру, т. е. М(r) = a.

В противном случае оценка называется смещенной.

Если это равенство не выполняется, то оценка г, получен­ная по разным выборкам, будет в среднем либо завышать значе­ние a (если М(r) > a, либо занижать его (если М(r) < 0). Та­ким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

Оценка в n параметра a называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятно­сти к оцениваемому параметру:

В случае использования состоятельных оценок оправдывается увеличение объема выборки, так как при этом становятся ма­ловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки.
Несмещенная оценка r n параметра a называется эффектив­ной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра a, вычисленных по выборкам одного и того же объема n.
Так как для несмещенной оценки M(r n - a)2есть ее дис­персия , то эффективность является решающим свойством, определяющим качество оценки.
Для нахождения оценок параметров (характеристик) генераль­ной совокупности используется ряд методов.
Указанные критерии оценок (несмещенность, состоятель­ность, эффективность) обязательно учитываются при разных способах оценивания.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: