Множественная линейная регрессия

Пример 4. Предположим, что коммерческий агент рассматривает возможность закупки небольших зданий под офисы в традиционном деловом районе. Агент может использовать множественный регрессионный анализ для оценки цены здания под офис на основе следующих переменных:

у – оценочная цена здания под офис;

х1 – общая площадь в квадратных метрах;

х2 – количество офисов;

х3 – количество входов;

х4 – время эксплуатации здания в годах.

Агент наугад выбирает 11 зданий из имеющихся 1500 и получает следующие данные:

 

 

  А В С D Е
1 х1- площадь, м2 х2 – офисы х3 – входы х4 – срок, лет у – цена, у.е.
2 2310 2 2 20 42000
3 2333 2 2 12 144000
4 2356 3 1,5 33 151000
5 2379 3 2 43 151000
6 2402 2 3 53 139000
7 2425 4 3 23 169000
8 2448 2 1,5 99 126000
9 2471 2 2 34 142000
10 2494 3 3 23 163000
11 2517 4 4 55 169000
12 2540 2 3 22 149000

 

«Пол-входа» означает вход только для доставки корреспонденции.

В этом примере предполагается, что существует линейная зависимость между каждой независимой переменной (х1,х2,х3,х4) и зависимой переменной (у), т.е. ценой зданий под офис в данном районе.

· выделим блок ячеек А14:Е18 (в соответствии с табл. 1),

· введём формулу =ЛИНЕЙН(Е2:Е12;А2:D12;ИСТИНА;ИСТИНА), -

· нажмём клавиши Ctrl+Shift+Enter,

· в выделенных ячейках появится результат:

 

  А В С D E
14 -234,237 2553,210 12529,7682 27,6413 52317,83
15 13,2680 530,6691 400,066838 5,42937 12237,36
16 0,99674 970,5784 #Н/Д #Н/Д #Н/Д
17 459,753 6 #Н/Д #Н/Д #Н/Д
18 1732393319 5652135 #Н/Д #Н/Д #Н/Д

 

Уравнение множественной регрессии у=m1*x2+m2*x2+m3*x3+ m4*x4+b теперь может быть получено из строки 14:

              у=27,64*х1+12530*х2+2553*х3-234,24*х4+52318        (14)

Теперь агент может определить оценочную стоимость здания под офис в том же районе, которое имеет площадь 2500 м2, три офиса, два входа, зданию 25 лет, используя следующее уравнение:

    у=27,64*2500+12530*3+2553*2-234,24*25+52318=158261 у.е.

Это значение может быть вычислено с помощью функции ТЕНДЕНЦИЯ:

                =ТЕНДЕНЦИЯ(Е2:Е7;A2:D12;{2500;3;2;25}).

При интерполяции с помощью функции

          =ЛГРФПРИБЛ(Е2:Е7;A2:D12;ИСТИНА;ИСТИНА)

для получения уравнения множественной экспоненциальной регрессии выводится результат:

 

0,99835752 1,0173792 1,0830186 1,0001704 81510,335
0,00014837 0,0065041 0,0048724 6,033Е-05 0,1365601
0,99158875 0,0105158 #Н/Д #Н/Д #Н/Д
176,832548 6 #Н/Д #Н/Д #Н/Д
0,07821851 0,0006635 #Н/Д #Н/Д #Н/Д
#Н/Д #Н/Д #Н/Д #Н/Д #Н/Д

 

Коэффициент детерминированности здесь составляет 0,992 (99,2%), т.е. меньше, чем при линейной интерполяции, поэтому в качестве основного следует оставить уравнение множественной регрессии (14).

Таким образом, функции ЛИНЕЙН, ЛГРФПРИБЛ, НАКЛОН определяют коэффициенты, свободные члены и статистические параметры для уравнений одномерной и множественной регрессии, а функции ТЕНДЕНЦИЯ, ПРЕДСКАЗ, РОСТ позволяют получить прогноз новых значений без составления уравнения регрессии по значениям тренда.

 

Задание

Вариант задания к данной лабораторной работе включает две задачи. Для каждой из них необходимо составить и определить:

1. Таблицу исходных данных, а также значений, полученных методами линейной и экспоненциальной регрессии.

2. Коэффициенты в уравнениях прямой и экспоненциальной кривой (функции ЛИНЕЙН и ЛГРФПРИБЛ), напишите уравнения прямой и экспоненциальной кривой для простой и множественной регрессии.

3. Погрешности (ошибки) прямой и экспоненциальной кривой, вычислений для коэффициентов и функций, коэффициенты детерминированности. Оценить, какой тип регрессии наилучшим образом подходит для вашего варианта задания.

4. Прогноз изменения данных, выполненный с использованием линейной и экспоненциальной регрессии (функции ТЕНДЕНЦИЯ, ПРЕДСКАЗ, РОСТ).

5. Построить гистограмму (или график) исходных данных для задачи 1 (одномерная регрессия), отобразить на ней линию тренда, а также соответствующее ей уравнение и коэффициент детерминированности.

Варианты заданий

(номер варианта соответствует номеру компьютера)

Вариант 1.

1. На рынке наблюдается стойкое снижение цен на компьютеры. Сделать прогноз, на сколько необходимо будет снизить цену на компьютеры в следующем месяце в вашей фирме, чтобы как минимум сравнять её с ценой на аналогичные компьютеры в конкурирующей фирме, если известна динамика изменения цен на них в конкурирующей фирме за последние 12 месяцев.

Для выполнения задания нужно ввести ряд из 12 ячеек с ценами конкурирующей фирмы, сделать прогноз цены на следующий месяц и др. (см. Задание).

2. Известна структура расходов фирмы на рекламу в газетах, на радио, в журналах, на телевидении, на наружную рекламу (в процентах от общей суммы), а также оборот фирмы в каждом за последние 6 месяцев. Какой оборот можно ожидать в следующем месяце, если предполагается следующая структура расходов на рекламу: газеты-40%, журналы-40%, радио-5%, телевидение-14%, наружная реклама-1%.

Для выполнения задания нужно составить таблицу со столбцами вида:

 

Месяц Х1-газеты, % Х2-журн., % Х3-рад., % Х4-телев., % Х5-нар. рекл., % Оборот, $
1 37 34 12 10 5 410000
2 38 37 10 11 6 411500
3 39 38 9 13 7 413700
4 40 39 8 15 8 417050
5 41 40 7 16 9 420000
6 42 42 5 17 10 425000

 

и сделать множественный регрессионный прогноз (см. Задание).

 

Вариант 2.

1. Имеются данные об объеме продаж в расчете на душу населения по хлебу и молоку и данные по годовым доходам на душу за 10 лет. По каждому товару построить модели регрессии для объемов продаж и функции размера доходов. Сделать прогноз о продажах и доходах на следующий год.

Для выполнения задания нужно составить таблицу вида:

 

Годы 1 2 3 4 5 6 7 8 9 10 11
Х1-хлеб, кг 23,5 26,7 27,9 30,1 31,5 35,7 38,3 40,1 41,5 42,8  
Х2-молоко, л 20,45 22 23,8 25,9 27,4 29 33,5 36,8 38,1 39,5  
У-доход, р. 6600 7200 8400 10500 12750 14730 16240 17000 18050 18250  

 

и получить два уравнения – у=f(x1) и у=f(x2), сделать прогноз на следующий год для рядов х1, х2, у и др. (см. Задание).

2. Руководство фирмы провело оценку качеств пяти рекламных агентов по следующим признакам: х1 – эрудиция, х2 – знание предметной области. Полученные средние оценки, нормированные от 0 до 1, были сопоставлены с оценками эффективности деятельности агентов (% успешных сделок от количества возможных). Определить эффективность для агента с усреднёнными качествами. Сравнить её со средней эффективностью упомянутых 5 агентов.

Исходные данные нужно ввести в таблицу вида:

 

  А В С D E F G
1   Х1-эрудиция Х2-энергичность Х3-люди Х4-внешность Х5-знания Эффективность
2 Агент 1 0,8 0,2 0,4 0,6 1,0 76%
3 Агент 2 0,74 0,3 0,39 0,58 0,95 78%
4 Агент 3 0,67 0,41 0,35 0,5 0,83 79%
5 Агент 6 0,59 0,59 0,33 0,47 0,8 80%
6 Агент 5 0,5 0,7 0,3 0,4 0,74 81%
7

Средняя эффективность пяти агентов

8 Средний агент 0,5 0,5 0,5 0,5 0,5  

 

Массив ячеек В2-F6 заполняется произвольными числами от 0 до 1, столбец G2-G6 – процентами удачных сделок по принципу «Чем выше уровень качеств агента, тем выше эффективность его работы», в ячейке G7 должна быть формула для вычисления среднего значения ячеек G2:G6, в ячейке G8 нужно вычислить значение эффективности для среднего агента по формуле, полученной в результате множественного регрессионного анализа работы пяти агентов. Остальные пункты – см. Задание.

 

Вариант 3.

1. Автосалон имеет данные о количестве проданных автомобилей «Мерседес» и «БМВ» за последние 4 квартала. Учитывая тенденцию изменения объёма продаж, определить, каких автомобилей нужно закупить больше («Мерседес» или «БМВ») в следующем квартале?

Для выполнения задания нужно составить и заполнить таблицу вида:

 

Х 1 2 3 4 5
Мерседес (Y1) 10 12 15 18  
БМВ (Y2) 9 10 14 17  

 

сделать прогноз продаж на новый квартал и выполнить другие пункты задания.

2. Известны следующие данные о 5 недавно проданных подержанных автомобилях: у – стоимость продажи, х1 – стоимость аналогичного нового автомобиля, х2 – год выпуска, х3 – пробег, х4 – количество капитальных ремонтов, х5 – экспертные заключения о состоянии кузова и техническом состоянии автомобилей (по 10-бальной шкале). Определить, сколько может стоить автомобиль с соответствующими характеристиками: 340 000, 1998г., 140000км., 1, 6 (см. пример 4).

 

Вариант 4.

1. Определить минимально необходимый тираж журнала и возможный доход от размещения в нём рекламы в следующем месяце, если известны данные об объёмах продаж этого журнала и доходах от размещения рекламы за последние 12 месяцев (считать, что расценки на рекламу не менялись).

Для выполнения задания нужно составить таблицу вида:

 

Месяц 1 2 3 4 5 6 7 8 9 10 11 12
Тираж, тыс. 100 120 121,7 124,2 128 130,1   133,45 136 141 142,1 143,8 145
Доход, тыс. руб. 128 135 138 142 147 154 159 161 163 168 170,5 172

 

и заполнить ячейки за 12 месяцев условными данными. По этим данным нужно сделать линейный и экспоненциальный прогноз и др. (см. Задание).

2. В целях привлечения покупателей и увеличения оборота фирма проводит стратегию ежемесячного снижения цен на свой товар. На основании данных о динамике изменения цен, объемов продаж в данной фирме и ещё в 3 конкурирующих фирмах за последние 12 месяцев сделать прогноз о том, возрастает ли объём продаж у данной фирмы при очередном снижении цен в следующем месяце, если предположить, что цены и объёмы у конкурентов в следующем месяце будут средние за рассматриваемый период.

Для выполнения задания нужно составить таблицу вида:

Мес.

Фирма

Конкурент 1

Конкурент 2

Конкурент 3

1 У-объём Х1-цена Х2-объём Х3-цена Х4-объём Х5-цена Х6-объём Х7-цена
2 10000 1875 12000 1720 12500 1740 11970 1700
3 11000 1850 12340 1705 12620 1735 12100 1690
4 11570 1810 12750 1675 12740 1710 12350 1645
5 11850 1750 12910 1630 12960 1695 12500 1615
6 12100 1685 13100 1615 13000 1674 12630 1580
7 12340 1630 13570 1600 13210 1625 12920 1545
8 12750 1615 13820 1575 13320 1610 13150 1520
9 12910 1600 13980 1515 13460 1560 13300 1500
10 13100 1575 14000 1500 13600 1525 13610 1490
11 13230 1530 14070 1495 13780 1500 13850 1485
12 13470 1510 14120 1488 13900 1460 14000 1475
13                

Вариант 5.

1. На основании данных о курсе американского доллара и немецкой марки в первом полугодии сделать прогноз о соотношении данных валют на второе полугодие. Во что будет выгоднее вкладывать деньги в конце года?

Для выполнения задания нужно составить таблицу вида:

 

Месяц 1 2 3 4 5 6 7 8 9 10 11 12
Доллар 24,5 24,9 25,7 26,9 28,0 28,8 29,3 29,7 30,5 30,9 31,8  
Марка 72,1 76,3 79,6 85,3 89,7 90,9 93,2 96,4 100,2 101,6 104,9  

и сделать линейный прогноз на следующие 6 месяцев и др. (см. Задание).

2. Известны данные за последние 6 месяцев о том, сколько раз выходила реклама фирмы, занимающейся недвижимостью, на телевидении – х1, радио – х2, в газетах и журналах – х3, а также количество звонков – у1 и количество совершённых сделок – у2. Какое соотношение количества совершённых сделок к количеству звонков у (в %) можно ожидать в следующем месяце, если известно, сколько раз выйдет реклама в каждом из перечисленных средств массовой информации.

Для выполнения задания нужно составить и заполнить таблицу вида:

  A B C D E
1 месяц х1 х2 х3 y=у21*100%
2 1 15 10 24 78%
3 2 16 11 23 80%
4 3 18 12 22 81%
5 4 19 12 22 84%
6 5 21 13 21 85%
7 6 22 14 20 89%
8 7        

 

и выполнить применительно к таблице пункты Задания.

 

Вариант 6.

1. Для некоторого региона известен среднегодовой доход населения, а также данные о структуре расходов (тыс. руб. в год) за последние 5 лет по следующим статьям: питание – х1, жильё – х2, одежда – х3, здоровье – х4, транспорт – х5, отдых – х6, образование – х7. На основании известных данных провести анализ потребительского кредита (или накопления) в следующем 6 году.

Для выполнения задания нужно составить и заполнить таблицу вида

 

Годы Х1 Х2 Х3 Х4 Х5 Х6 Х7 Расход (∑xi) Доход Кредит(Y)
1 5 2 1,3 1 0,3 5 4 18,6 21,4 3,1
2 5,2 2,2 1,2 1,2 0,4 4,8 4,5 19,5 22 2,5
3 5,5 2,5 1,1 1,4 0,6 4,6 4,9 20,6 23,4 2,8
4 5,8 2,7 0,9 1,6 1 4,2 5,6 21,8 25,8 4
5 7 3 0,8 2 1,2 4 6,5 24,7 26,2 1,5
6 7,5 3,3 0,7 2,2 1,5 3,8 7 26,5 27,5  

 

В ячейках столбца ∑хi должны быть записаны формулы, вычисляющие суммы всех расходов х12+…+х7 в каждом году, в ячейках столбца Доход – соответствующие среднегодовые доходы, в ячейках столбца Кредит – формулы разности содержимого ячеек с ежегодными доходами и затратами, т.е. Кредит = Доход-∑хi. Затем для столбца Кредит нужно выполнить регрессионный прогноз на следующий год и другие пункты Задания.

2. Для 10 однокомнатных квартир, расположенных в одном районе, известны следующие данные: общая площадь – х1, жилая площадь – х2, площадь кухни – х3, наличие балкона – х4, телефона – х5, этаж – х6, а также стоимость – y. Определить, сколько может стоить однокомнатная квартира в этом районе без балкона, без телефона, расположенная на    1-ом этаже, общей площадью 28 м2, жилой  – 16 м2, с кухней 6 м2.

 

Квартиры

X1

X2

X3

X4

X5

Стоимость (y)

1

41

33

7

1

2

42000

2

40

30

7,7

2

3

40000

3

45

37

8

0

5

47000

4

46,3

34

9

1

6

49500

5

50

36

9

1

4

51000

6

53

40

9,5

1

7

55000

7

56

41

10

0

9

62000

8

60

47

12

2

10

62300

9

65

49

14

2

12

69000

10

70

58

14,5

2

14

72000

11

28

16

6

0

1

 

Вариант 7.

1. Определить возможный прирост населения (кол-во человек на 1000 населения) в 2011 году, если известны данные о кол-ве родившихся и умерших на 1000 населения в 1997-2006 годах.

 

Годы 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2011
Родились 100 110 130 155 170 174 180 185 190 200  
Умерли 108 115 135 160 178 180 186 190 197 205  

 

2. После некоторого спада наметился рост объёмов продаж матричных принтеров. Используя данные об объёмах продаж, ценах на матричные, струйные и лазерные принтеры, а также на их расходные материалы за последние 6 месяцев, определить возможный спрос на матричные принтеры в следующем месяце.

Проанализируйте, связано ли увеличение спроса на матричные принтеры с уменьшением спроса на струйные и лазерные.

 

Матричные принтеры

Струйные принтеры

Лазерные принтеры

  Спрос у1 Цена х1 Рас.мат. z1 Спрос у2 Цена х2 Рас.мат. z2 Спрос у3 Цена х3 Рас.мат. z3
1 56 4172 174 26 2384 558 13 12517 1558
2 58 4250 179 24 2398 570 11 12984 1612
3 60 4289 182 23 2401 598 9 13259 1789
4 65 4297 194 20 2456 649 8 13687 1865
5 69 4305 205 19 2512 722 7 14013 1998
6 75 4318 213 18 2543 768 6 14587 2200
7   4456 220 17 2601 779 5 14789 2245

Необходимо сделать прогноз на седьмой месяц по уравнению у1=f(x1,z1), получить уравнение y=(y2, x2, z2, y3, x3, z3) и проанализировать его. Если слагаемые у2 и у3 входят в регрессионное уравнение со знаком «-», то уменьшение спросов у2 и у3 ведёт к увеличению спроса у1.

Вариант 8.

1. Построить прогноз развития спроса населения на телевизоры, если известна динамика продаж телевизоров (тыс. шт.) и динамика численности населения (тыс. чел.) за 10 лет. По данным таблицы сделать прогноз по обоим рядам на следующий год. Выполнить другие пункты задания.

 

Годы 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Динамика населения (тыс. чел) 21,5 26,1 31,5 34,9 45,1 50,8 56 59,4 63,9 67,1  
Динамика продаж (тыс. шт.) 2,5 2,9 3,4 3,9 4,1 4,8 5 5,6 5,9 6,2  

2. Размещая рекламу в 4-х изданиях, фирма собрала сведения о поступивших на нее откликов – у и сопоставила их с данными об изданиях: х1 – стоимость издания, х2 – стоимость одного блока рекламы, х3 – тираж, х4 – объём аудитории, х5 – периодичность, х6 – наличие телепрограммы. Какое количество откликов можно ожидать на рекламу в издании со следующими характеристиками: 15000 руб., 10$, 1000 экз., 25000 чел., 4 раза в месяц, без телепрограммы.

Пользуясь данными таблицы

 

Издания Х1 Х2 Х3 Х4 Х5 Х6 Отклики, у
1 10000 13 700 15000 4 1 108
2 12500 12 850 22000 8 1 115
3 15890 11,8 960 28000 10 0 120
4 17850 11 1200 32000 26 1 128
5 15000 10 1000 25000 4 0  

 

необходимо сделать прогноз при заданных характеристиках.

Вариант 9.

1. Размещая свою рекламу в 2-х печатных изданиях одновременно, фирма собрала сведения о количестве поступивших звонков и количестве заключенных сделок по объявлениям в каждом из указанных изданий за последние 12 месяцев. Определить, в каком из изданий и насколько эффективность размещения рекламы в следующем месяце будет больше?

 

Месяцы

Издание 1

Издание 2

Звонки Сделки Звонки Сделки
1 98 66 112 79
2 105 72 143 85
3 105 75 150 90
4 110 80 130 100
5 125 90 120 75
6 140 100 115 80
7 136 95 128 82
8 137 87 132 78
9 145 102 138 88
10 123 75 143 92
11 130 79 150 97
12 139 88 155 97
13        

 

Эффективность определяется как сделки/звонки. Сделать линейный и экспоненциальный прогнозы по обоим изданиям.

2. Пусть комплект мягкой мебели (диван + 2 кресла) характеризуется стоимостью комплектующих: х1- деревянные подлокотники, х2 – велюровое покрытие, х3 – кресло-кровать, х4 – угловой диван, х5 – раскладывающийся диван, х6 – место для хранения белья. По данным о стоимости 5 комплектов сделать вывод о возможной стоимости комплекта с обычным раскладывающимся диваном, с местом для белья, без деревянных подлокотников и велюрового покрытия, с креслом кроватью.

Пользуясь данными таблицы

 

Признаки Х1 Х2 Х3 Х4 Х5 Х6 У -стоимость
Комплект 1 250 540 2500 4300 6400 800 13850 руб.
Комплект 2 320 650 3000 4800 7000 980 15770 руб.
Комплект 3 400 730 3900 6000 8500 1100 16730 руб.
Комплект 4 452 1300 4300 7500 9200 2050 24350 руб.
Комплект 5 550 1750 6400 12450 16700 4300 42150 руб.
Комплект 6 670 800 2750 6700 8800 1000  

сделать прогноз и выполнить другие пункты задания.

Вариант 10.

1. Для 2-х радиостанций известны данные об изменении объёма аудитории и динамике роста цен за 1 минуту эфирного времени за последние 12 месяцев. Определить, для какой радиостанции стоимость одного контакта со слушателем будет меньше?

 

 

Месяц

Радиостанция 1

Радиостанция 2

Аудитория Цена 1 мин. Аудитория Цена 1 мин.
1 250000 8000 300000 7560
2 540000 6500 450000 6340
3 580000 6460 490000 6250
4 650000 6300 550000 6000
5 730000 6060 610000 5730
6 750000 6000 690000 5300
7 800000 5400 750000 5100
8 840000 5320 780000 5000
9 890000 5130 870000 4700
10 950000 5000 900000 4650
11 1000000 4800 940000 4600
12 1108000 4700 1025000 4540
13        
Контакт        

 

В строке «Контакт» в ячейках С8 и D8 должны быть записаны формулы = С7/В7 и =Е7/D7 соответственно, вычисляющие стоимость 1 мин. Эфира для одного слушателя в прогнозируемом месяце. Прогноз нужно выполнить для линейного и экспоненциального приближений и выбрать более достоверный, а также сделать другие пункты Задания.

2. На основании данных ежемесячных исследований известна динамика рейтинга банка (в условных единицах) за последние 6 месяцев в следующих сферах:

а) менеджмент и технология – х1;

б) менеджеры и персонал – х2;

в) культура банковского обслуживания – х3;

г) имидж банка на рынке финансовых услуг – х4;

д) реклама банка – х5.

Определить возможное изменение количества вкладчиков данного банка в следующем месяце, если известны значения сфер рейтинга и количество вкладчиков в каждом из рассматриваемых 6 месяцев.

 

Месяц х1 х2 х3 х4 х5 Количество вкладчиков (у)
1 2 5 5 5 4 110000
2 4 6 6,5 5,5 4,5 119000
3 5 7 7 6 5,5 125000
4 6 8 8 7,5 6 129000
5 7 9 8,5 8 7 140000
6 8 10 9 8,5 7,5 148000
7 9 11 10 9 8  

 

Выполнить другие пункты Задания.

Контрольные вопросы

 

1. Сущность регрессионного анализа, его использование для прогнозирования функций.

2. Как получить уравнения одномерной линейной регрессии, каков синтаксис функции линейного приближения?

3. Как получить уравнение многомерной линейной регрессии, каков синтаксис функции?

4. Как получить уравнение одномерной экспоненциальной регрессии, каков синтаксис функции экспоненциального приближения?

5. Как получить уравнение многомерной экспоненциальной регрессии, каков синтаксис функции экспоненциального приближения?

6. Каковы правила ввода и использования табличных формул?

7. Как на гистограмме исходных данных добавить линию тренда?

8. Как с помощью линии тренда отобразить прогнозируемые величины?

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: