Задачи и методы их решения на ЭВМ при проведении многофакторного регрессионного анализа

Выбор вида кривой в регрессионном анализе может проводиться по специальным программам на ЭВМ, для чего задают класс функций, из которого ЭВМ выбирает по некоторым критериям подходящую функцию. Часто задают класс функций, называемых полиномами (или многочленами) и имеющих вид.

Известно, что практически всякую линию регрессии можно аппроксимировать полиномом с любой точностью. При задании ЭВМ полинома машина определит его порядок m, обеспечивающий приемлемое значение принятого критерия.

В случае множественной корреляции метод наименьших квадратов заключается в нахождении оценки, обеспечивающей минимальную сумму квадратов отношений, где,, …, – i -е реализации факторов,, …,. Линейное уравнение множественной регрессии: Также представляют интерес коэффициенты эластичности, которые показывают степень ''управляемости'' y по каждому из учтённых факторов: чем больше по абсолютной величине, тем сильнее воздействует на y изменение. Множественный регрессионный анализ необходим для более полного исследования воздействия изучаемых факторов на результативный признак.

Многофакторный регрессионный анализ проводят на ЭВМ с использованием пакета программ. При этом решаются следующие задачи:

- отбирают факторы, которые оказывают заметное влияние на результативный признак y и поэтому должны включаться в уравнение регрессии;

- находят функциональную зависимость от каждого из учитываемых факторов, рассматриваемых в совокупности;

- проверяют уровень адекватности полученного уравнения по F - критерию (или по другому критерию) и, если он высок, уравнение принимают.

В уравнение регрессии обязательно включают факторы, сильно коррелированные с результативным признаком. Если имеются пары факторов, сильно коррелированных один с другим (это явление называется мультикорреляцией), то в уравнение регрессии включается лишь один фактор из такой пары, а именно тот, который сильнее коррелирован с результативным признаком.

Для решения всех этих задач используют различные методы. Одним из наиболее широко применяемых является метод пошагового построения уравнения регрессии, включающего все факторы, которые оказывают существенное влияние на результативный признак.

В качестве примера приведём уравнение множественной регрессии, связывающее производительность труда с факторами, оказывающими заметное влияние на неё. Всего было рассмотрено 12 факторов, из которых пошаговым методом были отобраны, как главные, 4. Ими оказались: электровооружённость; удельный вес (доля) оборудования, проработавшего более 20 лет; удельный вес универсально-сборных приспособлений (УСП) в общем количестве используемых приспособлений; коэффициент использования планового фонда времени работы оборудования. Высоким уровнем адекватности обладает линейное уравнение, имеющее вид

Коэффициент множественной детерминации для этих четырёх факторов оказался весьма высоким:. Иначе говоря, эти четыре фактора более, чем на 97 % определяют изменение производительности труда. Из полученного уравнения регрессии могут быть сделаны выводы, имеющие важное практическое значение. Так, в частности, можно показать, что если факторы,,, улучшатся на 10% по сравнению с имеющимися значениями, то производительность труда возрастёт на 24,1%.

Кроме наиболее распространенного метода наименьших квадратов, параметры регрессионного уравнения многофакторной связи можно рассчитывать с помощью коэффициентов парной корреляции, т.е. коэффициентов корреляции между признаком-фактором и результативным признаком, не учитывающим взаимодействия этого признака-фактора с другими признаками.

При множественной корреляционной зависимости для линий регрессии должны быть подобраны соответствующие типы кривых (прямая как частный случай). Например, если форма зависимости между данным признаком и каждом из двух факторов x, z представлена в виде параболы второго порядка, то уравнение регрессии можно выразить так:

.

Уравнение регрессии может иногда состоять из сочетания уравнения прямой со степенным уравнением или из линейных уравнений множественной зависимости. Некоторые из этих уравнений после логарифмирования и замены переменных приводят к линейной форме. Если заранее неизвестен тип функции, описывающий связь между функцией и аргументами, её можно представить в виде полинома n -го порядка, о чём упоминалось при рассмотрении парного анализа. Вообще всё, что говорилось о парном регрессионном анализе, подходит и для множественного.

Для интерпретации коэффициентов уравнения множественной регрессии используют частный коэффициент эластичности, который имеет вид. Частный коэффициент эластичности показывает, на сколько процентов в среднем изменится функция с изменением аргумента на один процент при фиксированном значении других аргументов.

Коэффициент частной корреляции характеризует влияние факторного признака, входящего в корреляционное уравнение, и измеряет тесноту связи между признаком y и, например, при условии, что остальные фактора не оказывают на него влияния. Коэффициент частной корреляции вычисляется по формуле: где – коэффициент множественной корреляции, вычисленный при условии, что на результативный признак действует все факторы; – то же при условии, что на результативный признак действуют все факторы, кроме k -го.

Коэффициент парной корреляции неравен соответствующему коэффициенту частной корреляции. Первый измеряет тесноту связи между признаками, не учитывая их взаимодействия с другими признаками, а второй – тесноту связи с учётом взаимодействия с другими факторами.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: