Анализ перекрёстных данных

Основная цель любого научного (в том числе и эконометрического) исследования – количественное описание взаимосвязей между переменными, которые характеризуют изучаемый процесс. Например, полезно знать, как цена товара связана с объёмом его реализации. Знание формы взаимосвязи этих переменных позволяет прогнозировать сбыт товара при изменении в будущем его цены в ту или иную сторону.

Приступая к решению подобных задач, следует в первую очередь ответить на вопросы: есть ли вообще связь между изучаемыми переменными, какова сила этой связи? Интуитивно ясно, что чем теснее связь между переменными, тем больше информации содержит одна переменная относительно другой, тем точнее можно спрогнозировать неизвестное значение одной переменной по заданной величине другой.

Измерение тесноты взаимосвязи переменных составляет содержание корреляционного анализа. Форму (то есть формулу) взаимосвязи переменных устанавливают методами регрессионного анализа. Обозначим некоторые принципиальные моменты корреляционного и регрессионного анализа на простом примере взаимосвязи двух переменных Y и X. В специальной литературе зависимую переменную Y называют результирующей, объясняемой, а независимую переменную X, которая определяет изменение Y, называют объясняющей, факторной переменной.

В зависимости от тесноты взаимосвязи между переменными Y и X различают следующие варианты.

Полная, точная взаимосвязь, при которой каждому значению величины X соответствует строго определенное значение Y. Такую связь называют функциональной. Например, площадь круга функционально зависит от его радиуса. Функциональную связь изучают в классических естественных науках (физике, математике, механике и т. д.).

Другой предельный вариант – полное отсутствие связи между независимыми переменными.

Промежуточный вариант неполной связи характерен для всех реально наблюдаемых величин. В частности, неполные, неточные связи между экономическими переменными обусловлены целым рядом причин: во-первых, трудно выявить все факторы, влияющие на экономический показатель; во-вторых, это влияние может быть не прямым, а опосредованным, то есть проявляться через цепочку других факторов; в-третьих, многие факторы в экономике носят случайный характер и т. д.

В силу названных причин экономические явления характеризуются случайными переменными, взаимосвязь которых всегда статистическая, то есть неполная.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частном случае, когда при изменении одной из величин изменяется только среднее значение другой, а закон распределения сохраняется, статистическая зависимость называется корреляционной.

Приведем пример. Пусть Y – урожай зерна, а X – количество удобрений на единицу площади. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают разный по величине урожай, то есть связь Y и X не является полной (функциональной). Разница в значениях Y при одном и том же X объясняется влиянием других, в том числе и случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, то есть Y связан с X корреляционной зависимостью.

При корреляционной связи каждому значению независимой переменной X соответствует не одно значение Y, а совокупность с некоторым средним по совокупности . Именно это среднее значение меняется в зависимости от X. Математически этот факт записывается в виде

, (1)

где условное математическое ожидание величины Y, соответствующее фиксированному значению х случайной величины Х; – некоторая функция.

Уравнение (1) называется уравнением регрессии Y на X, функция f(x)функцией регрессии, а ее график – линией регрессии.

При рассмотрении зависимости двух переменных говорят о парной регрессии. Уравнение парной регрессии определяет, каким в среднем будет значение результативного признака Y при каждом фиксированном значении факторного признака X.

В зависимости от вида функции регрессии говорят о той или иной форме зависимости между изучаемыми величинами – линейной, квадратичной, экспоненциальной и т. д.

Таким образом, процедура решения основной задачи эконометрики – описание взаимосвязи экономических переменных – состоит из двух последовательных этапов. Сначала в ходе корреляционного анализа исследуют наличие и силу связи между переменными. При положительном заключении (связь есть и она достаточно тесная) переходят ко второму этапу по определению формы связи между переменными средствами регрессионного анализа.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: