Общий вид линейной многофакторной модели

Общая схема процесса регрессионного анализа

Регрессионный анализ – раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по данным статистических наблюдений. Регрессия – зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин. Смысл регрессионного анализа состоит в выводе уравнения регрессии (включая оценку его параметров), с помощью которого оценивается величина случайной переменной, если величина другой (или других в случае множественной или многофакторной регрессии) известна, т.е. фиксирована, неслучайна.

В отличие от этого корреляционный анализ применяется для нахождения и выражения тесноты связи между случайными величинами, хотя часто эти методы объединяют в корреляционный анализ.

Практически речь идёт о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключённую в этом множестве закономерность, тенденцию – линию регрессии.

Существует ряд математико-статистических приёмов, позволяющих решить эту задачу. В случае, когда искомая закономерность может быть принята за линейную, наиболее эффективен метод наименьших квадратов.

Регрессионный анализ применяется в различного рода экономических исследованиях (производственные функции, анализ эластичности спроса от цены и др.), особенно при анализе хозяйственной деятельности предприятий (для определения влияния отдельных факторов на результаты) и во многих других областях экономической науки и хозяйственной практики.

Пример: средняя себестоимость поковок в кузнечных цехах машиностроительных заводов, по статистическим исследованиям, описывается следующим уравнением регрессии:

, где – заработная плата на 1 т поковок, – удельная металлоёмкость, – удельные цеховые расходы. Это уравнение означает, что лишний расход одного рубля заработной платы приведёт (приблизительно, в среднем) к повышению средней себестоимости тонны поковок на руб. Соответственно рассчитывается и влияние 2-х остальных факторов.

Таким образом, регрессионный анализ является методом статистической обработки наблюдений, в результате которой оказывается возможным составить уравнение регрессии и получить количественную оценку влияния факторных признаков на результативный признак.

В общем смысле мы можем сказать, что регрессионный анализ является одним из методов моделирования какого-либо случайного процесса, который можно представить следующим соотношением:, где – известный оператор преобразования, X – вектор входных неслучайных воздействий, – вектор выходных параметров, - вектор случайных параметров с известными законами распределения вероятностей.

Рисунок 8.1 – Общая схема процесса регрессионного анализа

Пусть производится измерений случайной величины Каждое измерение зависит от некоторого числа параметров, которые могут принимать или дискретные, или непрерывные значения. Эту зависимость обычно представляют в виде линейной комбинации параметров с коэффициентами.

(8.1)

где – индекс фактора (), – случайная ошибка измерения. Величины,,…, называются факторами. Уравнение (8.1) называется линейной многофакторной моделью.

Оценивая с помощью метода наименьших квадратов для уравнения факторы,,…,, составим сумму, где,,…, – средние квадратические оценки случайных факторов, – значения непрерывных переменных Уравнение

(8.2)

называется уравнением регрессии. Главной задачей регрессионного анализа является получение оптимальных оценок,,…,, называемых коэффициентами регрессии. Уравнение (8.1) можно записать в виде

или в матричной форме

(8.3)

где ,,, – матрица, транспонированная к матрице

Оценку факторов,,…, в уравнении (8.3) на основе метода наименьших квадратов можно получить по формуле:, где – матрица, обратная к матрице.

Регрессия называется парной, или однофакторной, если рассматривается влияние только одного фактора; и множественной, или многофакторной, если рассматривается влияние одновременно совокупности нескольких факторов. Уравнение парной зависимости можно представить в виде уравнения кривой (в частном случае прямой), называемой линией регрессии. Уравнение регрессии даёт описание корреляционной зависимости результативного признака Y от учтённых факторов. Уравнения регрессии парной зависимости могут иметь различный вид:,,,,,, и др., где a и b – некоторые параметры. Они находятся чаще всего, как уже упоминалось, методом наименьших квадратов. Для построения уравнения регрессии по результатам наблюдений сначала полезно построить корреляционное поле. Как оно строится, известно из курса статистики.