Цель: Освоить методы построения основных видов нелинейных уравнений парной регрессии с помощью ЭВМ (внутренне линейные модели), научиться получать и анализировать показатели качества регрессионных уравнений.
Рассмотрим случай, когда нелинейные модели с помощью преобразования данных можно свести к линейным (внутренни линейные модели).
ПРИМЕР. Некоторая организация желает исследовать зависимость полученной прибыли Y (сотни тыс. руб.) от вложения средств в научные разработки выпускаемой продукции Х (тыс. руб.). Для этого рассматриваются 4 регрессионных уравнения: линейное: , гиперболическое , экспоненциальное и степенное . В результате наблюдений, получены данные:
Прибыль Y | |||||||||||
Вложения Х |
Введем данные в таблицу вместе с подписями (ячейки А1-L2). Оставим свободными три строчки ниже таблицы для ввода преобразованных данных, выделим первые пять строк, проведя по левой серой границе по числам от 1 до 5 и выбрать какой либо цвет (светлый – желтый или розовый) раскрасить фон ячеек. Далее, начиная с A6, выводим параметры линейной регрессии. Для этого в ячейку А6 делаем подпись «Линейная» и в соседнюю ячейку В6 вводим функцию ЛИНЕЙН (категория «Статистические», см. предыдущую лабораторную работу). В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В1-L1 и В2-L2, следующие два поля принимают значения по единице. Далее обводим область ниже в 5 строчек и левее в 2 строки (ячейки В6-С10) и нажимаем F2 и Ctrl+Shift+Enter. Результат – таблица с параметрами регрессии, из которых наибольший интерес представляет коэффициент детерминации в первом столбце третий сверху. В нашем случае он равен R1=0,90627178. Значение F-критерия, позволяющего проверить адекватность модели F1=87,02230833 (четвертая строка, первый столбец). Уравнение регрессии равно (коэффициенты а и b приведены в ячейках В6 и С6).
|
|
Определим аналогичные характеристики для других регрессий и в результате сравнения коэффициентов детерминации найдем лучшую регрессионную модель. Рассмотрим гиперболическую регрессию. Для ее получения преобразуем данные. В третьей строек в ячейку А3 введем подпись «1/х» а в ячейку В3 введем формулу «=1/В2». Растянем автозаполнением данную ячейку на область В3-L3. Получим характеристики регрессионной модели. В ячейку А12 введем подпись «Гипербола», а в соседнюю функцию ЛИНЕЙН. В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В1-L1 и преобразованные данные аргумента х – В3-L3, следующие два поля принимают значения по единице. Далее обводим область ниже в 5 строчек и левее в 2 строки и нажимаем F2 и Ctrl+Shift+Enter. Получаем таблицу параметров регрессии. Коэффициент детерминации в данном случае равен R2=0,345994664, что намного хуже, чем в случае линейной регрессии. F-статистика равна F2=4,761355604. Уравнение регрессии равно .
|
|
Рассмотрим экспоненциальную регрессию. Для ее линеаризации получаем уравнение , где , , . Видно, что надо сделать преобразование данных - у заменить на ln y. Ставим курсор в ячейку А4 и делаем заголовок «ln y». Ставим курсор в В4 и вводим формулу LN (категория «Математические»). В качестве аргумента делаем ссылку на В1. Автозаполнением распространяем формулу на четвертую строку на ячейки В4-L4. Далее в ячейке F6 задаем подпись «Экспонента» и в соседней G6 вводим функцию Линейн, аргументами которой будут преобразованные данные В4-L4 (в поле «Изв_знач_у»), а остальные поля такие же как и для случая линейной регрессии (В2-L2, 1, 1). Далее обводим ячейки G6-H10 и нажимаем F2 и Ctrl+Shift+Enter. Результат R3= 0,979276, F3= 425,2748, что говорит об очень хорошей регрессии. Для нахождения коэффициентов уравнения регрессии ставим курсор в J6 и делаем заголовок «а=», а в соседней К6 формулу «=EXP(H6)», в J7 даем заголовок «b=» а в К7 формулу «=G6». Уравнение регрессии есть .
Рассмотрим степенную регрессию. Для ее линеаризации получаем уравнение , где , , , . Видно, что надо сделать преобразование данных - у заменить на ln y и х заменить на ln x. Строчка с ln y у нас уже есть. Преобразуем переменные х. В ячейку А5 даем подпись «ln x», а в В5 и вводим формулу LN (категория «Математические»). В качестве аргумента делаем ссылку на В2. Автозаполнением распространяем формулу на пятую строку на ячейки В5-L5. Далее в ячейке F12 задаем подпись «Степенная» и в соседней G12 вводим функцию Линейн, аргументами которой будут преобразованные данные В4-L4 (в поле «Изв_знач_у»), и В5-L5 (в поле «Изв_знач_х»), остальные поля – единицы. Далее обводим ячейки G12-H16 и нажимаем F2 и Ctrl+Shift+Enter. Результат R4= 0,895786, F4= 77,36103, что говорит об хорошей регрессии. Для нахождения коэффициентов уравнения регрессии ставим курсор в J12 и делаем заголовок «а=», а в соседней К12 формулу «=EXP(H12)», в J13 даем заголовок «b=» а в К13 формулу «=G12». Уравнение регрессии есть .
Проверим, все ли уравнения адекватно описывают данные. Для этого нужно сравнить F-статистики каждого критерия с критическим значением. Для его получения вводим в А21 подпись «F-критическое», а в В21 функцию FРАСПОБР, аргументами которой вводим соответственно «0,05» (уровень значимости), «1» (число факторов Х в строке «Уровень значимости 1») и «9» (степень свободы 2 = n-2). Результат 5,117357. Видно, что F – статистика для первой третьей и четвертой регрессионной модели больше, чем F – критическое, значит эти модели адекватны. А гиперболическая регрессия неадекватна, т.к. . Для того, чтобы определить, какая модель наилучшим образом описывает данные, сравним индексы детерминации для каждой модели . Наибольшим является R3= 0,979276. Значит, опытные данные лучше описывать моделью .
Задание на самостоятельную работу
Построить уравнение регрессии y = f (x) для выборки xi, yi, (i =1,2,...,10).
В качестве f(x) рассмотреть четыре типа функций - линейная, степенная, показательная и гиперболу:
Необходимо найти их коэффициенты а и b, и, сравнив показатели качества, выбрать функцию, которая наилучшим образом описывает зависимость.
Вари-ант | Значения xi (для всех вариантов) | |||||||||
0,25 | 0,50 | 0,75 | 1,00 | 1,25 | 1,50 | 1,75 | 2,00 | 2,25 | 2,50 | |
Значения уi (по вариантам) | ||||||||||
1. | 5,3 | 5,8 | 6,4 | 6,9 | 8,0 | 7,6 | 8,3 | 9,0 | 9,3 | 10,1 |
2. | 8,4 | 8,4 | 10,2 | 9,8 | 11,2 | 11,8 | 12,3 | 13,7 | 13,2 | 15,0 |
3. | 13,4 | 9,2 | 7,4 | 7,3 | 6,4 | 6,2 | 6,3 | 6,5 | 6,1 | 5,8 |
4. | 17,8 | 11,6 | 10,8 | 9,5 | 9,5 | 8,9 | 8,9 | 8,3 | 8,6 | 8,2 |
5. | 0,3 | 1,2 | 2,8 | 5,2 | 8,1 | 11,0 | 16,8 | 16,9 | 24,7 | 29,4 |
6. | 0,1 | 0,4 | 1,4 | 2,6 | 5,6 | 10,3 | 14,8 | 22,6 | 34,4 | 45,2 |
7. | 12,7 | 10,3 | 8,5 | 6,8 | 5,8 | 4,7 | 3,9 | 3,1 | 2,6 | 2,1 |
8. | 6,6 | 4,5 | 3,2 | 2,2 | 1,5 | 1,0 | 0,7 | 0,4 | 0,3 | 0,2 |
9. | 19,1 | 17,3 | 20,1 | 17,6 | 18,9 | 15,4 | 17,7 | 15,7 | 15,2 | 15,6 |
10. | 2,1 | 3,0 | 3,4 | 5,0 | 6,2 | 7,2 | 7,3 | 9,7 | 9,7 | 11,0 |
11. | 12,0 | 16,2 | 15,9 | 17,6 | 17,7 | 18,4 | 19,7 | 18,6 | 19,3 | 19,7 |
12. | 17,1 | 9,4 | 6,7 | 5,1 | 4,0 | 3,7 | 3,2 | 3,0 | 2,8 | 2,7 |
13. | 46,8 | 12,1 | 5,1 | 3,2 | 1,8 | 1,3 | 1,0 | 0,7 | 0,6 | 0,5 |
14. | 0,1 | 0,1 | 0,3 | 1,0 | 2,5 | 5,1 | 9,4 | 16,0 | 26,4 | 40,8 |
15. | 1,6 | 2,1 | 3,1 | 4,7 | 5,9 | 10,0 | 16,4 | 22,3 | 43,9 | 45,2 |
|
|