Задача регрессионного анализа

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель y и аргументы ,отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Функция ,описывающая зависимость условного среднего значения результативного признака y от заданных значений аргументов, называется функцией (уравнением) регрессии.

Термин "регрессия" (лат. - "regression" - отступление, возврат к чему-либо) введен английским психологом и антропологом Ф. Гальтоном и связан только со спецификой одного из первых конкретных примеров, в котором это понятие было использовано.

Обрабатывая статистические данные в связи с вопросом о наследственности роста, Ф. Гальтон нашел, что если отцы отклоняются от среднего роста всех отцов на х дюймов, то их сыновья отклоняются от среднего роста всех сыновей меньше, чем на дюймов. Выявленная тенденция была названа «регрессией к среднему состоянию».

Пример 3.1. Задачи подобного типа обычно связаны с анализом условий протекания производственных и технологических процессов. Примером может служить процесс получения аммиака путем выделения его из отходящих газов при коксовании угля. Отходящие газы, содержащие азот , водород и углекислый газ , должны быть очищены от углекислого газа. Затем получение аммиака происходит по схеме:

Процесс очистки газа происходит путем пропускания отходящих газов через слой движущейся воды, поглощающей . Под величиной y будем понимать качество очистки, характеризующееся процентным содержанием и очищенном газе. На качество очистки влияет, прежде всего, температура отходящих газов и расход воды, которые можно принять за переменные и . Однако на качество очистки влияет и множество случайных факторов, начиная с качества угля икончая температурой окружающего воздуха.

Будем считать , которые принято называть факторами, входными величинами некоторого технологического или экономического процесса, а y будем рассматривать как выходную величину (результат) этого процесса, что схематически может быть изображено схемой, показанной на рис. 4.1.

Технологически или экономически процесс

Входы Выход

Рис 3.1. Структурная схема технологического или экономического процесса

Выходную величину y в обобщенном виде можно записать следующим образом:

, (3.1)

где детерминированная составляющая, обусловленная влиянием и изменением факторов ; случайная составляющая, обусловленная действием случайных неконтролируемых факторов.

Составляющая считается случайной величиной, имеющей нормальное распределение с нулевым математическим ожиданием. В этом случае детерминированная составляющая представляет собой условное математическое ожидание значения у при данных значениях факторов , т. е.

. (3.2)

Здесь представляет собой вектор значений входных переменных, который может рассматриваться как точка в мерном пространстве переменных , называемом далее факторным пространством.

Цель дальнейшего рассмотрения — определение по данным эксперимента вида зависимости (3.2), которая представляет собой некоторую поверхность в факторном пространстве, называемую поверхностью отклика.

Задача регрессионного анализа состоит в экспериментальном определении коэффициентов регрессии путем наблюдения за характером изменения входных переменных и выходной переменной у. При этом входные параметры иначе называют факторными признаками или экзогенными (внешними) переменными. Выходную зависимую величину у называют эндогенной (внутренней) переменной модели или результативной величиной (результатом) процесса. Этой цели могут, служит методы пассивного или активного эксперимента.

Пассивный эксперимент основан на регистрации контролируемых параметров в процессе нормальной работы объекта без внесения каких-либо преднамеренных возмущений. Активный эксперимент основан на использовании искусственных возмущений, вводимых в объект по заранее спланированной программе. Каждый из этих способов имеет свои достоинства и недостатки.

При активном эксперименте введение искусственных возмущений позволяет целенаправленно и быстро вскрывать нужные зависимости между параметрами, нащупывать области оптимального режима работы. Однако введение искусственных возмущений может привести к нарушению нормального хода технологического процесса.

При пассивном эксперименте вмешательства в ход производственного процесса не происходит и экспериментатор просто ожидает естественного проявления интересующих его закономерностей, что значительно удлиняет время эксперимента. При этом математическое описание получается лишь для области, близкой к рабочей точке объекта, которая может значительно отличаться от оптимального режима.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

5 6 7 8 9 10 11

Среднее квадратическое отклонение

Основные теории происхождения государства

Гражданская война в России. Причины, ход, итоги и последствия

ВИДЫ ОРУЖИЯ МАССОВОГО ПОРАЖЕНИЯ И ПОСЛЕДСТВИЯ ЕГО ПРИМЕНЕНИЯ

Методика обучения ребенка строевым упражнениям

Средства ЛФК. Классификация физических упражнений в ЛФК и их характеристика

Самый сильный аргумент, почему эволюция человека не могла быть