Прикладной экономический анализ

 

Теплообменные аппараты являются составной частью оборудования энергетических установок, имеющих широкое применение в промышленности, а также на судах гражданского и военного флотов.

Создание совершенного и надежного в эксплуатации оборудования, отвечающего современному уровню развития техники, требует всестороннего изучения происходящих в аппаратах процессов и технологии их производства на базе экспериментальных исследований и производственного опыта.

За прошедшие послевоенные годы проведен ряд научно-исследовательских и экспериментальных работ по теплотехнике, что способствовало накоплению значительного опыта по проектированию, изготовлению и испытанию теплообменных аппаратов.

Используя статистические данные, полученные при расчетах различных теплообменников, хотелось бы выяснить, есть ли связь между отношением предела прочности стали к коэффициенту теплопроводности теплообменного аппарата?

В качестве объекта в данном исследовании будет использоваться статистические данные, полученные при расчетах теплообменных аппаратов.

Используя полученные эмпирические данные, можно получить количественное выражение гипотетического линейного соотношения между двумя переменными.

 

 (9.1)

 

где – значение успеваемости в i-м наблюдении;

 – значение независимой переменной в i-м наблюдении;

 – нестохастическая составляющая ;

 – стохастическая составляющая .

Для решения данной проблемы необходимо использовать методику парного регрессионного анализа, задача которого заключается в оценке характера связи между независимой переменной X и зависимой переменной Y с помощью линейной модели:

 

,(9.2)

 

где – оценочное значение зависимой переменной по методу МНК;

 – значение независимой переменной в i-м наблюдении;

 – оцениваемые параметры регрессии.

На основе дифференциальных расчетов можно вывести следующие формулы расчета коэффициентов (параметров) регрессии:

 

,(9.3)

 

,(9.4)

 

где – выборочная ковариация между X и Y;

 – выборочная дисперсия переменной X;

 – выборочное среднее переменных Y и X;

 – количество наблюдений в выборке.

После того как будут найдены параметры b1 и b2, как оценки истинных коэффициентов регрессии β1 и β2, можно определить прогнозные (оценочные) значения объясняемой переменной с помощью формулы 9.2. Значения коэффициентов полученной линии регрессии будут всегда зависеть от тех значений Xi и Yi, которые случайным образом попали в исходную выборку. И то, насколько они близки или, наоборот, далеки от истинных коэффициентов β1 и β2, можно установить с помощью коэффициента детерминации R2, который определяется по формуле:

 

(9.5)

 

Для установления закономерностей природы выборочной дисперсии рекомендуется также проверить расчетным способом баланс дисперсий:

 

(9.6)

 

Случайный характер значений переменных X и Y в выборке предопределяет значения полученных параметров регрессии b1 и b2. Эти коэффициенты, вычисленные с помощью метода наименьших квадратов, представляют собой особую форму случайной величины. Они описывают соответствующие истинные коэффициенты и  лишь отчасти, имея в себе влияние случайного члена .

Введем формулы для оценки стандартного отклонения функции плотности вероятности только для коэффициента регрессии b2:

 

(9.7)

(9.8)

 

где  – несмещенная оценка теоретической дисперсии случайного члена .

Используя значения стандартных ошибок коэффициентов регрессии, можно судить о степени их точности лишь в общих чертах, так как невозможно знать, где именно находятся найденные коэффициенты b1 и b2 – в середине распределения или в «хвосте»?

На следующем этапе можно начать статистическое исследование с целью проверки гипотезы о значимости линейной зависимости между двумя переменными. Гипотеза, которую необходимо проверить, является нулевой гипотезой. Она состоит в том, что β2 равняется нулю. Это означает, что угловой коэффициент, равный нулю, показывает отсутствие линейной связи между переменными. Естественно, нулевая гипотеза в данном случае выдвигается с осознанным намерением максимально строго проверить ее и конечно же опровергнуть, так как надежда всего исследования заключается в том, что исследуемая переменная Y все же зависит от переменной X. Поэтому также определяется альтернативная гипотеза, которая представляет заключение, делаемое в том случае, если экспериментальная проверка указала на ложность H0. В данном случае эта гипотеза состоит в том, что β2 не равна нулю. Таким образом, можно сформулировать две гипотезы с использованием следующих обозначений:

 

(9.9)

 

Далее нужно определить величину z на основе использования стандартной ошибки с.о.(b2). Эта величина получила название «t-статистика».

 

(9.10)

 

Нужно установить критический уровень t-статистики для того, чтобы либо опровергнуть, либо принять нулевую гипотезу. Как видно из формулы 9.10, t-статистика показывает число стандартных ошибок между регрессионной оценкой и гипотетическим значением для β2. Следовательно, условием того, что оценка регрессии не должна приводить к отказу от нулевой гипотезы , будет следующее:

 

(9.11)

 

Иными словами, правилом для принятия решения является: H0 отвергается, если абсолютная величина z будет больше значения tкрит, и не отвергается в обратном случае. Критические значения t зависят от уровня значимости гипотезы и числа степеней свободы. Величины tкрит можно узнать в статистических справочниках.

Если результат оценивания регрессии подтвердит, что между переменными существует связь, то есть на исследуемую переменную Y определенно влияет независимая переменная X, то в дальнейшем можно провести исследование на оценку доверительного интервала, в котором с определенной вероятностью должен находиться гипотетический коэффициент β2. В этом случае статистическая проверка гипотезы проводится уже после самого эконометрического вывода коэффициентов регрессии.

Для этого необходимо выявить такие совместимые с имеющейся оценкой b2 значения β2, которые будут удовлетворять следующему соотношению:

 

(9.12)

 

Множество всех этих значений, определенных как интервал между нижней и верхней границами неравенства, и называется доверительным интервалом для величины β2.

Для проверки качества оценивания случайной величины Y можно применить F-статистику, основанную на анализе дисперсии. Она находится как отношение объясненной суммы квадратов в расчете на одну незвасимую переменную к остаточной сумме квадратов в расчете на одну степень свободы:

 

(9.13)

 

Далее нужно принять нулевую гипотезу о том, что связь между Y и X отсутствует, т.е. H0: β2 = 0. Затем на основе уже найденного значения R2 рассчитывается F-критерий. После его нахождения нужно отыскать критическое значение F в соответствующей таблице F-распределения. Если найденное значение F больше критического, то нулевая гипотеза об отсутствии связи между Y и X отклоняется и делается вывод о том, что имеющееся в изучаемой регрессионной модели «объяснение» поведения величины Y лучше, чем можно было бы получить чисто случайно.[9]

В качестве объекта в данном исследовании будет использоваться статистические данные, полученные при расчетах теплообменных аппаратов таблица 9.1. Применяя теорию парного регрессионного анализа, построим практическую модель для исследуемой эмпирической выборки значений Х и Y.


Таблица 9.1 Данные предела прочности стали и коэффициента теплопроводности.

Марка стали

Максимальный предел прочности Средне статистический предел прочности Отношение максимального предела прочности к среднестатистическому Коэффициент теплопрово дности

 

Xmax

Xсред

Хi=Xmax/Xсред

Yi

15л

40

50,111

0,798

1,068

20л

42

50,111

0,838

1,055

25л

45

50,111

0,898

1,209

30л

48

50,111

0,957

1,071

35л

50

50,111

0,997

0,905

40л

53

50,111

1,057

0,928

45л

55

50,111

1,097

0,931

50л

58

50,111

1,157

1,049

55л

60

50,111

1,197

0,93

 

Прежде всего, необходимо найти коэффициенты регрессии. Необходимые для этого расчеты представлены в таблице 9.2.

 

Таблица 9.2 – Определение коэффициентов регрессии

Марка стали

15л

0,798

1,068

-0,202

0,052

-0,010

0,04062

20л

0,838

1,055

-0,162

0,039

-0,006

0,02610

25л

0,898

1,209

-0,102

0,193

-0,020

0,01031

30л

0,957

1,071

-0,043

0,055

-0,002

0,00181

35л

0,997

0,905

-0,003

-0,111

0,000

0,00001

40л

1,057

0,928

0,057

-0,088

-0,005

0,00330

45л

1,097

0,931

0,097

-0,085

-0,008

0,00950

50л

1,157

1,049

0,157

0,033

0,005

0,02479

55л

1,197

0,93

0,197

-0,086

-0,017

0,03898

Сумма

8,996

9,146

0

0

-0,064

0,15542

Среднее

1,000

1,0162

 

 

-0,00706

0,01727

 


Далее по формулам 9.3 и 9.4 найдем коэффициенты b2 и b1:

b2 = -0,00706/0,01727= - 0,409

b1 = 1,0162-1*(- 0,409) =1,4252.

На рисунке 9.1 представлено корреляционное поле, на котором изображены точки с координатами изучаемых случайных переменных, а также прямая линия регрессии Y|i=- 0,409х + 1,4252.

 

Рисунок 9.1 – Линия регрессии

 

Как видно из рисунка, качество регрессии достаточно высокое, так как мало значение дисперсии остатков, т.е. расхождений между и . Для установления значения уровня достоверности аппроксимации необходимо рассчитать коэффициент детерминации R2. Все необходимые для этого расчеты представлены в таблице 9.3.

 

Таблица 9.3 – Расчет вариаций

Марка стали

 

 

 

 

 

 

 

 

15л

1,068

1,0988

0,0518 0,0826 -0,0308 0,0027 0,0068 0,0009

20л

1,055

1,0825

0,0388 0,0662 -0,0275 0,0015 0,0044 0,0008

25л

1,209

1,0580

0,1928 0,0417 0,1510 0,0372 0,0017 0,0228

30л

1,071

1,0335

0,0548 0,0172 0,0375 0,0030 0,0003 0,0014

35л

0,905

1,0171

-0,1112 0,0009 -0,1121 0,0124 0,0000 0,0126

40л

0,928

0,9926

-0,0882 -0,0236 -0,0646 0,0078 0,0006 0,0042

45л

0,931

0,9763

-0,0852 -0,0399 -0,0453 0,0073 0,0016 0,0021

50л

1,049

0,9518

0,0328 -0,0644 0,0972 0,0011 0,0042 0,0094

55л

0,93

0,9355

-0,0862 -0,0808 -0,0055 0,0074 0,0065 0,000030
Сумма

9,146

9,1460 0,0000 0,0000 0,0000 0,0803 0,0261 0,05428
Среднее

1,02

1,02       0,0089 0,0029 0,0060

R2 = 0,0029/0,0089= 0,32381

 

Таким образом установлено, что аппроксимация достоверна практически на 32,5% (доля объясненной части дисперсии случайной величины Y).

Далее нужно статистически проверить гипотезу о значимости линейной зависимости между двумя переменными X и Y. Выдвигаем нулевую гипотезу, которая состоит в том, что β2 равняется нулю. Это означает, что между отношением предела прочности стали и коэффициентом теплопроводности нет никакой связи. Естественно, нулевая гипотеза выдвигается с намерением проверить ее и конечно же опровергнуть, так как надежда всего исследования заключается в том, что связь все-таки есть. Кроме того, сформулируем альтернативную гипотезу о наличии такой связи.

Далее по формуле 9.7 рассчитывается стандартная ошибка углового коэффициента b2. Для этого по формуле 9.8 находим  – несмещенную оценку теоретической дисперсии случайного члена .

 

 = 0,05428/(9–2) = 0,007754;

 

c.o(b2)=  =0,2233

 

На основе стандартной ошибки с.о.(b2) по формуле 9.10 получим значение t-статистики углового коэффициента b2:

 

z = (- 0,409– 0)/ 0,2233= -1,83


Для того чтобы принять или опровергнуть нулевую гипотезу об отсутствии связи нужно найти критическое значение t-распределения. Это можно сделать с помощью функции СТЬЮДРАСПОБР в программе MS Excel. В анализируемом примере число степеней свободы составляет 7 (9-2). Сначала проверим значимость коэффициента b2 с 95-процентной вероятностью:

 

tкрит (чсс=7; α=0,05) =2,364624251

 

Так как имеющаяся t-статистика углового коэффициента b2 (-1,83) не удовлетворяет условию 9.13, то есть она меньше по модулю чем критическое значение t-статистики, поэтому следует не отвергать нулевую гипотезу. Таким образом, с 95-процентной вероятностью можно констатировать факт того, что связь между пределом прочности и коэффициентом теплопроводности может быть подтверждена статистической проверкой.

В заключении следует проверить качество нашего оценивания случайной величины Y при помощи F-статистики, которая находится по данным таблицы 9.2 и по формуле 9.13:

 

F=3,352137111

 

Снова формулируется нулевая гипотеза о том, что связь между Y и X отсутствует, т.е. H0: β2 = 0. Затем находится критическое значение таблице F-распределения. Это можно сделать с помощью функции FРАСПОБР в программе MS Excel.

 

Fкрит (чсс1 = 1; чсс2 =7; α=0,05) = 5,591447848

 

Как видно, имеющееся значение F (3,352137111) меньше критического, значит нулевая гипотеза об отсутствии связи между Y и X подтверждается.







Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: