Термин «простая регрессия» указывает на то, что величина одной переменной оценивается на основе знаний о другой переменной. В отличие от простой многофакторная регрессия применяется для оценки переменной на основе знания двух, трёх и более переменных. Рассмотрим графический анализ простой линейной регрессии.
Предположим, имеются результаты отборочных испытании по предварительному найму на работу и производительности труда.
№ п/п | Результаты отбора (100 баллов), x | Производительность (20 баллов), y |
1 | 88 | 17 |
2 | 85 | 16 |
3 | 72 | 13 |
4 | 93 | 18 |
5 | 70 | 11 |
6 | 74 | 14 |
7 | 78 | 15 |
8 | 93 | 19 |
9 | 82 | 16 |
10 | 92 | 20 |
11 | 79 | 14 |
12 | 84 | 15 |
13 | 71 | 12 |
14 | 77 | 13 |
15 | 87 | 19 |
16 | 87 | 17 |
17 | 72 | 10 |
18 | 77 | 12 |
19 | 82 | 14 |
20 | 76 | 13 |
Нанеся точки на график, получим диаграмму (поле) рассеяния. Используем её для анализа результатов отборочных испытаний и производительности труда.
По диаграмме рассеяния проанализируем линию регрессии. В регрессионном анализе всегда указываются хотя бы две переменные. Систематическое изменение одной переменной связано с изменением другой. Основная цель регрессионного анализа заключается в оценке величины одной переменной, если величина другой переменной известна. Для полной задачи важна оценка производительности труда.
|
|
Независимой переменной в регрессионном анализе называется величина, которая используется в качестве основы для анализа другой переменной. В данном случае – это результаты отборочных испытаний (по оси X).
Зависимой переменной называется оцениваемая величина (по оси У). В регрессионном анализе может быть только одна зависимая переменная и несколько независимых переменных.
Для простого регрессионного анализа зависимость можно представить в двухкоординатной системе (х и у), по оси X – независимая переменная, по оси У – зависимая. Наносим точки пересечения таким образом, чтобы на графике была представлена пара величин. График называют диаграммой рассеяния. Ее построение – это второй этап регрессионного анализа, поскольку первый – это выбор анализируемых величин и сбор данных выборки. Таким образом, регрессионный анализ применяется для статистического анализа. Связь между выборочными данными диаграммы линейная.
Для оценки величины переменной у на основе переменной х необходимо определить положение линии, которая наилучшим образом представляет связь между х и у на основе расположения точек диаграммы рассеяния. В нашем примере это анализ производительности. Линия, проведенная через точки рассеяния – линия регрессии. Одним из способов построения линии регрессии, основанном на визуальном опыте, является способ построения от руки. По нашей линии регрессии можно определить производительность труда. При нахождении уравнения линии регрессии
|
|
часто применяют критерий наименьших квадратов. Наиболее подходящей является та линия, где сумма квадратов отклонений минимальна
Математическое уравнение линии роста представляет закон роста в арифметической прогрессии:
у = а – bх.
Y = а + bх – приведённое уравнение с одним параметром является простейшим видом уравнения связи. Оно приемлемо для средних величин. Чтобы точнее выразить связь между х и у, вводится дополнительный коэффициент пропорциональности b, который указывает наклон линии регрессии.