Понятие о корреляции и регрессии

Общие принципы проверки статистических гипотез

Сущность корреляционно-регрессионного анализа и моделирования

Понятие о корреляции и регрессии

ТЕМА 2. ОСНОВЫ ЭКОНОМЕТРИЧЕСКОГО АНАЛИЗА

План лекции:

Диалектический и исторический материализм рассматривают явления и процессы, происходящие в природе и в обществе в тесной связи и взаимозависимости. Это обусловлено тем, что явления и процессы объективного мира органически связаны между собой, зависят друг от друга и обуславливают друг друга. Поэтому одной из важнейших задач статистической науки является изучение, измерение и количественное выражение взаимосвязей между явлениями общественной жизни, установленными на основе качественного анализа.

Изучение взаимосвязей статистика решает с помощью особых методов, видоизменяющихся в зависимости от характера исходного материала и целей познания. Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей.

Методы исследования, измерения связей составляют важную часть методологии научного исследования, в т.ч. и статистического.

Между различными явлениями и их признаками различают два типа связей:

· Функциональную, или жестко детерминированную (наритмер, зависимость выработки продукции на одного работника от объема выхода продукции и численности работников);

· Статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).

Определение различия этих типов связей возможно тогда, когда они получают математическую формулировку в форме уравнения связи двух переменных.

При этом при изучении связей различают два вида признаков. Признак, от которого зависит другой признак, называют факторным (экзогенным). Зависимый признак называют результативным. В каждом конкретном случае для их установления необходим анализ природы связи.

Один и тот же признак в связи с другими признаками может вы ступать и как факторный и как результативный. Так, заработная плата рабочих в связи с производственным стажем выступает как результативный признак, а в связи с покупательной способностью населения факторный признак.

Функциональная связь между факторным и результативным признаками заключается в том, что при определенном значении факторного признака результативный признак принимает строго определенное значение, которое можно рассчитать по формуле, связывающей эти признаки.

Т.о. если с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменной, связь между ними является функциональной. Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит только от первой и ни от чего более. В реальной природе, а тем более в социально-экономических процессах этого быть не может.

Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но ее средние значения или другие статистические характеристики изменяются по определенному закону – связь является статистической. При статистической связи разным значениям одной переменной соответствуют разные распределения значений другой переменной.

Статистическое измерение связи решает две задачи:

а) определяет форму связи – регрессионный анализ;

б) устанавливает тесноту связи – корреляционный анализ.

Связь между социально-экономическими явлениями проявляется главным образом в форме корреляционной связи. Если, например, изучается связь между производственными затратами и объемом произведенной продукции, то при одинаковых затратах может получаться различный объем продукции. Корреляционная связь характеризуется следующим:

а) на результативный признак, кроме факторного, действует еще множество других признаков;

б) каждому значению аргумента соответствует не одно, а несколько значений функции;

в) между аргументом и функцией нельзя установить строгой зависимости.

Такая связь, при которой на величину результативного признака оказывают влияние, помимо факторного, множество других признаков, действующих в различных направлениях одновременно или последовательно, называется корреляционной связью [2].

Корреляционная зависимость проявляется только в средних величинах и выражает числовое соотношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.

Рисунок 2.1. – Основные особенности, присущие функциональной и корреляционной зависимостей

Если функциональная связь проявляется в каждом отдельном случае и не требует опытной проверки, то наличие корреляционной связи можно выявить только на основании множества фактов, т. е. при массовом сопоставлении фактов в виде общей тенденции, когда каждому значению факторного признака будет соответствовать не одно конкретное значение результативного признака, а их совокупность. В этом случае для выявления действующей связи необходимо найти среднее значение результативного признака для средних значений факторного признака.

Эти два вида связей (функциональную и корреляционную) не следует противопоставлять друг другу. Дело в том, что функциональная связь и полное отсутствие связи – предельные случаи корреляционной связи. Вместе с тем эти виды связей не следует смешивать.

Виды функциональной и корреляционной взаимосвязей

Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная.

По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной).

В зависимости от количества признаков, включенных в модель, корреляционные связи делятся на однофакторные и многофакторные.

Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.

В настоящее время корреляционный анализ (корреляционная модель) определяется как метод, применяемый тогда, когда данные наблюдений или эксперимента можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону.

Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Корреляция – статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Варианты зависимостей:

-Парная корреляция – отражает связь между двумя признаками, один из которых результативный, другой – факторный;

-Частная корреляция – характеризует зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

-Множественная корреляция – исследует зависимость результативного признака от нескольких факторных признаков.

После того, как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель y и аргументы x1, x2, …, xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Регрессия – линия, вид зависимости среднего значения результативного признака от факторного.

Т.о. регрессионная модель – это функция, описывающая зависимость между количественными характеристиками социально-экономических систем. Они строятся в тех случаях, когда известно, что зависимость между факторами существует и требуется получить ее математическое описание.

Т.о. регрессионный анализ заключается в определении аналитического выражения связи (формы связи), т.е. в выборе математического уравнения, выражающего зависимость между признаками.

Корреляционная связь между признаками возникает как:

Ø Причинная зависимость результативного признака (его вариации) от вариации факторного признака;

Ø Корреляционная связь между двумя следствиями общей причины;

Ø Взаимосвязь признаков, каждый из которых и причина и следствие

Ø Зависимость между факторами, при которой следствие определяется не одним фактором, а комплексом существенных факторов, действие которых сопровождается множеством случайных причин (например, зависимость урожайности от качества почвы, сорта, количества и состава удобрений, наличия техники и др. исследование таких зависимостей осуществляется путем построения многофакторной корреляционной модели).

Основной предпосылкой регрессионного анализа является то, что только результативный признак подчиняется нормальному закону распределения, а факторные признаки – произвольному закону распределения. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативными и факторными признаками.

Уравнение корреляционной связи (уравнение регрессии) – это аналитическое уравнение, с помощью которого выражается зависимость между признаками

В парной регрессии выбор вида математической функции y = (x) может быть осуществлен тремя методами:

· графический – достаточно нагляден, основан на поле корреляции;

· аналитический (т.е. исходя из теории изучаемой взаимосвязи), основан на изучении материальной природы связи исследуемых признаков;

· экспериментальный, выбор типа уравнения обычно осуществляется при обработке информации на компьютере путем сравнения величины остаточной дисперсии, рассчитанной при различных моделях: Dост.=

Величина остаточной дисперсии характеризует влияние прочих, не учтенных в модели, факторов. Чем меньше величина остаточной дисперсии, тем в меньшей степени наблюдается влияние прочих, не учитываемых в модели факторов, и данное уравнение регрессии лучше подходит к исходным данным.

Если величина остаточной дисперсии примерно одинакова для различных моделей, то предпочтение отдается более простым функциям, т.к. они в большей степени поддаются интерпретации и требуют меньшего объема наблюдений.

Однако! Большая величина коэффициента детерминации еще не означает, что уравнение правильно выражает закономерности связи. Это связано с тем, что чем больше число параметров уравнения регрессии, тем ближе значения коэффициента детерминации к 100%, независимо от реальной силы связи. Поэтому данный подход следует применять только в сочетании с другими.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: