Пример. Вычисление объема выпускаемой продукции и тем­пературы

Вычисление объема выпускаемой продукции и тем­пературы.

В табл. 16 приведены данные, полученные в результате экс­перимента, целью которого являлось определение тесноты связи между объемом выпуска продукции и температурой определенного технологического процесса.

1. Построить диаграмму рассеяния(корреляционное поле) для этой совокупности данных.

2. Оценить тесноту связи между объемом выпуска продукции и температурой.

Таблица 16

Данные по объему продукции и температуры процесса

Температура                      
Объем выпуска продукци , шт                      

1.Если мы построим корреляционное поле, то замечаем, что существует сильная нелинейнуя взаимосвязь, для которой характерен не­значительный случайный разброс.

Коэффициент парной корреляции, =-0,0155, бесполезен в случае такой нелинейной связи: с его помощью невозможно ре­шить, является связь увеличивающей или уменьшающей, по­скольку в действительности есть и то и другое. В этом случае целе­сообразно использовать корреляционное поле, поскольку оно демонстрирует, что для максимального увеличения объема выпус­каемой продукции температуру производственного процесса сле­дует установить равной примерно 700 "С. Объем продукции резко падает как при слишком высокой, так и при слишком низкой температуре. Этот важный вывод можно сделать, наблюдая на диаграмме сильную взаимосвязь между объемом продукции и температурой.

(Замечание. Близкое к нулю значение коэффициента кор­реляции может означать как отсутствие взаимосвязи в данных, так и наличие нелинейной взаимосвязи без преобладания направлен­ности вниз или вверх. Сильная нелинейная взаимосвязь может быть даже тогда, когда корреляция близка к нулю!)

2. Оценим тесноту связи между объемом выпуска продукции и температурой с помощью корреляционного отношения. Значения результативного признака разобьем на пять групп, т.е. (табл. 17). В основу группировки кладется исследуемый фактор .

Таблица 17

Таблица группированных данных

Номер группы Количество элементов в -й группе, Значения , попавшие в -ю группу Среднее значение в -й группе,  
    127; 139  
    147; 147  
    155; 154; 153  
    148; 146  
    136; 139 132,5

Вычислим общую среднюю , используя средние значения в каждой группе

.

Найдем межгрупповую дисперсию:

.

Вычислим общую дисперсию:

.

Получим корреляционное отношение

.

Значение свидетельствует о наличии сильного нелинейного влияния температуры на объем выпуска продукции.

4. Регрессионный анализ. Основная задача регрессионного анализа заключается в исследовании зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели.

В регрессионных моделях зависимая (объясняемая) переменная может быть представлена в виде функции , где , .независимые (объясняющие) переменные, или факторы. В качестве зависимой переменной может выступать практически любой показатель, харак­теризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов модели делятся на однофакторные (парная модель регрессии) и многофакторны е (модель множественной регрессии).

Связь между переменной и независимыми факторами можно охарактеризовать функцией регрессии , которая показывает, каково будет в среднем значение переменной , если переменные примут конкретные значения.

Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений.

Сформулируем регрессионную задачу для случая однофакторного признака.

Пусть имеется набор значений двух переменных: – объясняемая переменная и – объясняющая переменная, каждая из которых содержит наблюдений. Для того чтобы правильно выбрать тип регрессионного уравнения, следует знать условный закон распределения зависимой переменной . На основе графика не всегда удается определить его однозначно, поэтому строят несколько регрессионных моделей, а затем по определенным критериям определяют лучшую модель. Если в проводимом исследовании можно ограничиться построением линейной модели, выбирают ее. Такая популярность и предпочтительность объясняется тем, что математический аппарат для линейных моделей хорошо разработан, а сами модели легко интерпретируемы. Пусть между переменными и теоретически существует некоторая линейная зависимость

.

Это уравнение будем называть «истинным» уравнением регрессии.

Однако в действительности между и наблюдается не столь жесткая связь. Отдельные наблюдения будут отклоняться от линейной зависимости в силу воздействия различных причин. Обычно зависимая переменная находится под влиянием целого ряда факторов, в том числе и неизвестных исследователю, а также случайных причин (возмущения и помехи); существенным источ­ником отклонений в ряде случаев являются ошибки измерения. Отклонения от предполагаемой формы связи, естественно, могут возникнуть и в силу неправильного выбора вида уравнения, опи­сывающего эту зависимость. Учитывая возможные отклонения, линейное уравнение связи двух переменных (парную регрессию) пред­ставим в виде

,(3.6)

где - постоянная величина (или свободный член уравнения), - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений, – случайная переменная (случайная составляющая, остаток, возмущение). Коэффициент характеризует изменение переменной , при изменении значения на единицу. Если - переменные и положительно коррелированные, если < 0 – отрицательно коррелированны; – независимые одинаково распределенные случайные величины – остаток с нулевым математическим ожиданием () и постоянной дисперсией (). Она отражает тот факт, что изменение будет неточно описываться изменением , так как присутствуют другие факторы, неучтенные в данной модели. Таким образом, в данном уравнении значение каждого наблюдения представлено как сумма двух частей – систематической и случайной . В свою очередь, систематическую часть можно представить в виде уравнения . Можно сказать, что общим моментом для любой регрессионной модели является разбиение зависимой переменной на две части – объясненную и случайную. Рассчитанные значения называются теоретическими (выравнеными) значениями .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: