Задача регрессионного анализа

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показа­тель y и аргументы ,отбирают наиболее информативные аргу­менты, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Функция ,описывающая зависимость условного среднего значения результативного признака y от заданных значений аргументов, называется функцией (уравнением) регрессии.

Термин "регрессия" (лат. - "regression" - отступление, возврат к чему-либо) введен английским психологом и антропологом Ф. Гальтоном и связан только со спецификой одного из первых конкретных примеров, в котором это понятие было использовано.

Обрабатывая статистические данные в связи с вопросом о наследст­венности роста, Ф. Гальтон нашел, что если отцы отклоняются от среднего роста всех отцов на х дюймов, то их сыновья отклоняются от среднего роста всех сыновей меньше, чем на дюймов. Выявленная тенденция была названа «регрессией к среднему состоянию».

Пример 3.1. Задачи подобного типа обычно связаны с анализом условий протекания производственных и технологических процессов. Примером может служить процесс получения аммиака путем выделе­ния его из отходящих газов при коксовании угля. Отходящие газы, содержащие азот , водород и углекислый газ , должны быть очищены от углекислого газа. Затем получение аммиака про­исходит по схеме:

.

Процесс очистки газа происходит путем пропускания отходящих газов через слой движущейся воды, поглощающей . Под величиной y будем понимать качество очистки, характеризующееся процентным содержанием и очищенном газе. На качество очистки влияет, прежде всего, температура отходящих газов и расход воды, которые можно принять за переменные и . Однако на качество очистки влияет и множество случайных факторов, начиная с качества угля икончая температурой окружающего воздуха.

Будем считать , которые принято называть факторами, входными величинами некоторого технологи­ческого или экономического процесса, а y будем рассматривать как выходную величину (результат) этого процесса, что схематически может быть изображено схемой, показанной на рис. 4.1.

Технологически или экономически процесс

Входы Выход

Рис 3.1. Структурная схема технологического или экономического процесса

Выходную величину y в обобщенном виде можно записать следующим образом:

, (3.1)

где детерминированная составляющая, обусловленная влиянием и изменением факторов ; случайная составляющая, обусловленная действием случайных неконтролируемых факторов.

Составляющая считается случайной величиной, имеющей нормальное распределение с нулевым математи­ческим ожиданием. В этом случае детерминированная со­ставляющая представляет собой услов­ное математическое ожидание значения у при данных значениях факторов , т. е.

. (3.2)

Здесь представляет собой вектор зна­чений входных переменных, который может рассматри­ваться как точка в мерном пространстве переменных , называемом далее факторным пространством.

Цель дальнейшего рассмотрения — определение по дан­ным эксперимента вида зависимости (3.2), которая пред­ставляет собой некоторую поверхность в факторном про­странстве, называемую поверхностью отклика.

Задача регрессионного ана­лиза состоит в экспериментальном определении коэффи­циентов регрессии путем наблюдения за характером изме­нения входных переменных и выходной перемен­ной у. При этом входные параметры иначе называют факторными признаками или экзогенными (внешними) переменными. Выходную зависимую величину у называют эндогенной (внутренней) переменной модели или результативной величиной (результатом) процесса. Этой цели могут, служит методы пассивного или активного эксперимента.

Пассивный эксперимент основан на регистрации конт­ролируемых параметров в процессе нормальной работы объекта без внесения каких-либо преднамеренных возму­щений. Активный эксперимент основан на использовании искусственных возмущений, вводимых в объект по зара­нее спланированной программе. Каждый из этих способов имеет свои достоинства и недостатки.

При активном эксперименте введение искусственных возмущений позволяет целенаправленно и быстро вскры­вать нужные зависимости между параметрами, нащупы­вать области оптимального режима работы. Однако вве­дение искусственных возмущений может привести к на­рушению нормального хода технологического процесса.

При пассивном эксперименте вмешательства в ход про­изводственного процесса не происходит и эксперимента­тор просто ожидает естественного проявления интересу­ющих его закономерностей, что значительно удлиняет время эксперимента. При этом математическое описание получается лишь для области, близкой к рабочей точке объекта, которая может значительно отличаться от опти­мального режима.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: