После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель y и аргументы ,отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.
Функция ,описывающая зависимость условного среднего значения результативного признака y от заданных значений аргументов, называется функцией (уравнением) регрессии.
Термин "регрессия" (лат. - "regression" - отступление, возврат к чему-либо) введен английским психологом и антропологом Ф. Гальтоном и связан только со спецификой одного из первых конкретных примеров, в котором это понятие было использовано.
Обрабатывая статистические данные в связи с вопросом о наследственности роста, Ф. Гальтон нашел, что если отцы отклоняются от среднего роста всех отцов на х дюймов, то их сыновья отклоняются от среднего роста всех сыновей меньше, чем на дюймов. Выявленная тенденция была названа «регрессией к среднему состоянию».
|
|
Пример 3.1. Задачи подобного типа обычно связаны с анализом условий протекания производственных и технологических процессов. Примером может служить процесс получения аммиака путем выделения его из отходящих газов при коксовании угля. Отходящие газы, содержащие азот , водород и углекислый газ , должны быть очищены от углекислого газа. Затем получение аммиака происходит по схеме:
.
Процесс очистки газа происходит путем пропускания отходящих газов через слой движущейся воды, поглощающей . Под величиной y будем понимать качество очистки, характеризующееся процентным содержанием и очищенном газе. На качество очистки влияет, прежде всего, температура отходящих газов и расход воды, которые можно принять за переменные и . Однако на качество очистки влияет и множество случайных факторов, начиная с качества угля икончая температурой окружающего воздуха.
Будем считать , которые принято называть факторами, входными величинами некоторого технологического или экономического процесса, а y будем рассматривать как выходную величину (результат) этого процесса, что схематически может быть изображено схемой, показанной на рис. 4.1.
Технологически или экономически процесс |
Входы Выход
Рис 3.1. Структурная схема технологического или экономического процесса
Выходную величину y в обобщенном виде можно записать следующим образом:
|
|
, (3.1)
где детерминированная составляющая, обусловленная влиянием и изменением факторов ; случайная составляющая, обусловленная действием случайных неконтролируемых факторов.
Составляющая считается случайной величиной, имеющей нормальное распределение с нулевым математическим ожиданием. В этом случае детерминированная составляющая представляет собой условное математическое ожидание значения у при данных значениях факторов , т. е.
. (3.2)
Здесь представляет собой вектор значений входных переменных, который может рассматриваться как точка в мерном пространстве переменных , называемом далее факторным пространством.
Цель дальнейшего рассмотрения — определение по данным эксперимента вида зависимости (3.2), которая представляет собой некоторую поверхность в факторном пространстве, называемую поверхностью отклика.
Задача регрессионного анализа состоит в экспериментальном определении коэффициентов регрессии путем наблюдения за характером изменения входных переменных и выходной переменной у. При этом входные параметры иначе называют факторными признаками или экзогенными (внешними) переменными. Выходную зависимую величину у называют эндогенной (внутренней) переменной модели или результативной величиной (результатом) процесса. Этой цели могут, служит методы пассивного или активного эксперимента.
Пассивный эксперимент основан на регистрации контролируемых параметров в процессе нормальной работы объекта без внесения каких-либо преднамеренных возмущений. Активный эксперимент основан на использовании искусственных возмущений, вводимых в объект по заранее спланированной программе. Каждый из этих способов имеет свои достоинства и недостатки.
При активном эксперименте введение искусственных возмущений позволяет целенаправленно и быстро вскрывать нужные зависимости между параметрами, нащупывать области оптимального режима работы. Однако введение искусственных возмущений может привести к нарушению нормального хода технологического процесса.
При пассивном эксперименте вмешательства в ход производственного процесса не происходит и экспериментатор просто ожидает естественного проявления интересующих его закономерностей, что значительно удлиняет время эксперимента. При этом математическое описание получается лишь для области, близкой к рабочей точке объекта, которая может значительно отличаться от оптимального режима.