Нелинейная регрессия. Цель: Освоить методы построения основных видов нелинейных уравнений парной регрессии с помощью ЭВМ (внутренне линейные модели)

Цель: Освоить методы построения основных видов нелинейных уравнений парной регрессии с помощью ЭВМ (внутренне линейные модели), научиться получать и анализировать показатели качества регрессионных уравнений.

Рассмотрим случай, когда нелинейные модели с помощью преобразования данных можно свести к линейным (внутренни линейные модели).

ПРИМЕР. Некоторая организация желает исследовать зависимость полученной прибыли Y (сотни тыс. руб.) от вложения средств в научные разработки выпускаемой продукции Х (тыс. руб.). Для этого рассматриваются 4 регрессионных уравнения: линейное: , гиперболическое , экспоненциальное и степенное . В результате наблюдений, получены данные:

Прибыль Y                      
Вложения Х                      

Введем данные в таблицу вместе с подписями (ячейки А1-L2). Оставим свободными три строчки ниже таблицы для ввода преобразованных данных, выделим первые пять строк, проведя по левой серой границе по числам от 1 до 5 и выбрать какой либо цвет (светлый – желтый или розовый) раскрасить фон ячеек. Далее, начиная с A6, выводим параметры линейной регрессии. Для этого в ячейку А6 делаем подпись «Линейная» и в соседнюю ячейку В6 вводим функцию ЛИНЕЙН (категория «Статистические», см. предыдущую лабораторную работу). В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В1-L1 и В2-L2, следующие два поля принимают значения по единице. Далее обводим область ниже в 5 строчек и левее в 2 строки (ячейки В6-С10) и нажимаем F2 и Ctrl+Shift+Enter. Результат – таблица с параметрами регрессии, из которых наибольший интерес представляет коэффициент детерминации в первом столбце третий сверху. В нашем случае он равен R1=0,90627178. Значение F-критерия, позволяющего проверить адекватность модели F1=87,02230833 (четвертая строка, первый столбец). Уравнение регрессии равно (коэффициенты а и b приведены в ячейках В6 и С6).

Определим аналогичные характеристики для других регрессий и в результате сравнения коэффициентов детерминации найдем лучшую регрессионную модель. Рассмотрим гиперболическую регрессию. Для ее получения преобразуем данные. В третьей строек в ячейку А3 введем подпись «1/х» а в ячейку В3 введем формулу «=1/В2». Растянем автозаполнением данную ячейку на область В3-L3. Получим характеристики регрессионной модели. В ячейку А12 введем подпись «Гипербола», а в соседнюю функцию ЛИНЕЙН. В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В1-L1 и преобразованные данные аргумента х – В3-L3, следующие два поля принимают значения по единице. Далее обводим область ниже в 5 строчек и левее в 2 строки и нажимаем F2 и Ctrl+Shift+Enter. Получаем таблицу параметров регрессии. Коэффициент детерминации в данном случае равен R2=0,345994664, что намного хуже, чем в случае линейной регрессии. F-статистика равна F2=4,761355604. Уравнение регрессии равно .

Рассмотрим экспоненциальную регрессию. Для ее линеаризации получаем уравнение , где , , . Видно, что надо сделать преобразование данных - у заменить на ln y. Ставим курсор в ячейку А4 и делаем заголовок «ln y». Ставим курсор в В4 и вводим формулу LN (категория «Математические»). В качестве аргумента делаем ссылку на В1. Автозаполнением распространяем формулу на четвертую строку на ячейки В4-L4. Далее в ячейке F6 задаем подпись «Экспонента» и в соседней G6 вводим функцию Линейн, аргументами которой будут преобразованные данные В4-L4 (в поле «Изв_знач_у»), а остальные поля такие же как и для случая линейной регрессии (В2-L2, 1, 1). Далее обводим ячейки G6-H10 и нажимаем F2 и Ctrl+Shift+Enter. Результат R3= 0,979276, F3= 425,2748, что говорит об очень хорошей регрессии. Для нахождения коэффициентов уравнения регрессии ставим курсор в J6 и делаем заголовок «а=», а в соседней К6 формулу «=EXP(H6)», в J7 даем заголовок «b=» а в К7 формулу «=G6». Уравнение регрессии есть .

Рассмотрим степенную регрессию. Для ее линеаризации получаем уравнение , где , , , . Видно, что надо сделать преобразование данных - у заменить на ln y и х заменить на ln x. Строчка с ln y у нас уже есть. Преобразуем переменные х. В ячейку А5 даем подпись «ln x», а в В5 и вводим формулу LN (категория «Математические»). В качестве аргумента делаем ссылку на В2. Автозаполнением распространяем формулу на пятую строку на ячейки В5-L5. Далее в ячейке F12 задаем подпись «Степенная» и в соседней G12 вводим функцию Линейн, аргументами которой будут преобразованные данные В4-L4 (в поле «Изв_знач_у»), и В5-L5 (в поле «Изв_знач_х»), остальные поля – единицы. Далее обводим ячейки G12-H16 и нажимаем F2 и Ctrl+Shift+Enter. Результат R4= 0,895786, F4= 77,36103, что говорит об хорошей регрессии. Для нахождения коэффициентов уравнения регрессии ставим курсор в J12 и делаем заголовок «а=», а в соседней К12 формулу «=EXP(H12)», в J13 даем заголовок «b=» а в К13 формулу «=G12». Уравнение регрессии есть .

Проверим, все ли уравнения адекватно описывают данные. Для этого нужно сравнить F-статистики каждого критерия с критическим значением. Для его получения вводим в А21 подпись «F-критическое», а в В21 функцию FРАСПОБР, аргументами которой вводим соответственно «0,05» (уровень значимости), «1» (число факторов Х в строке «Уровень значимости 1») и «9» (степень свободы 2 = n-2). Результат 5,117357. Видно, что F – статистика для первой третьей и четвертой регрессионной модели больше, чем F – критическое, значит эти модели адекватны. А гиперболическая регрессия неадекватна, т.к. . Для того, чтобы определить, какая модель наилучшим образом описывает данные, сравним индексы детерминации для каждой модели . Наибольшим является R3= 0,979276. Значит, опытные данные лучше описывать моделью .

Задание на самостоятельную работу

Построить уравнение регрессии y = f (x) для выборки xi, yi, (i =1,2,...,10).

В качестве f(x) рассмотреть четыре типа функций - линейная, степенная, показательная и гиперболу:

Необходимо найти их коэффициенты а и b, и, сравнив показатели качества, выбрать функцию, которая наилучшим образом описывает зависимость.

Вари-ант Значения xi (для всех вариантов)
0,25 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 2,50
Значения уi (по вариантам)
1. 5,3 5,8 6,4 6,9 8,0 7,6 8,3 9,0 9,3 10,1
2. 8,4 8,4 10,2 9,8 11,2 11,8 12,3 13,7 13,2 15,0
3. 13,4 9,2 7,4 7,3 6,4 6,2 6,3 6,5 6,1 5,8
4. 17,8 11,6 10,8 9,5 9,5 8,9 8,9 8,3 8,6 8,2
5. 0,3 1,2 2,8 5,2 8,1 11,0 16,8 16,9 24,7 29,4
6. 0,1 0,4 1,4 2,6 5,6 10,3 14,8 22,6 34,4 45,2
7. 12,7 10,3 8,5 6,8 5,8 4,7 3,9 3,1 2,6 2,1
8. 6,6 4,5 3,2 2,2 1,5 1,0 0,7 0,4 0,3 0,2
9. 19,1 17,3 20,1 17,6 18,9 15,4 17,7 15,7 15,2 15,6
10. 2,1 3,0 3,4 5,0 6,2 7,2 7,3 9,7 9,7 11,0
11. 12,0 16,2 15,9 17,6 17,7 18,4 19,7 18,6 19,3 19,7
12. 17,1 9,4 6,7 5,1 4,0 3,7 3,2 3,0 2,8 2,7
13. 46,8 12,1 5,1 3,2 1,8 1,3 1,0 0,7 0,6 0,5
14. 0,1 0,1 0,3 1,0 2,5 5,1 9,4 16,0 26,4 40,8
15. 1,6 2,1 3,1 4,7 5,9 10,0 16,4 22,3 43,9 45,2

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: