Теплообменные аппараты являются составной частью оборудования энергетических установок, имеющих широкое применение в промышленности, а также на судах гражданского и военного флотов.
Создание совершенного и надежного в эксплуатации оборудования, отвечающего современному уровню развития техники, требует всестороннего изучения происходящих в аппаратах процессов и технологии их производства на базе экспериментальных исследований и производственного опыта.
За прошедшие послевоенные годы проведен ряд научно-исследовательских и экспериментальных работ по теплотехнике, что способствовало накоплению значительного опыта по проектированию, изготовлению и испытанию теплообменных аппаратов.
Используя статистические данные, полученные при расчетах различных теплообменников, хотелось бы выяснить, есть ли связь между отношением предела прочности стали к коэффициенту теплопроводности теплообменного аппарата?
В качестве объекта в данном исследовании будет использоваться статистические данные, полученные при расчетах теплообменных аппаратов.
|
|
Используя полученные эмпирические данные, можно получить количественное выражение гипотетического линейного соотношения между двумя переменными.
(9.1)
где – значение успеваемости в i-м наблюдении;
– значение независимой переменной в i-м наблюдении;
– нестохастическая составляющая ;
– стохастическая составляющая .
Для решения данной проблемы необходимо использовать методику парного регрессионного анализа, задача которого заключается в оценке характера связи между независимой переменной X и зависимой переменной Y с помощью линейной модели:
,(9.2)
где – оценочное значение зависимой переменной по методу МНК;
– значение независимой переменной в i-м наблюдении;
– оцениваемые параметры регрессии.
На основе дифференциальных расчетов можно вывести следующие формулы расчета коэффициентов (параметров) регрессии:
,(9.3)
,(9.4)
где – выборочная ковариация между X и Y;
– выборочная дисперсия переменной X;
– выборочное среднее переменных Y и X;
– количество наблюдений в выборке.
После того как будут найдены параметры b1 и b2, как оценки истинных коэффициентов регрессии β1 и β2, можно определить прогнозные (оценочные) значения объясняемой переменной с помощью формулы 9.2. Значения коэффициентов полученной линии регрессии будут всегда зависеть от тех значений Xi и Yi, которые случайным образом попали в исходную выборку. И то, насколько они близки или, наоборот, далеки от истинных коэффициентов β1 и β2, можно установить с помощью коэффициента детерминации R2, который определяется по формуле:
|
|
(9.5)
Для установления закономерностей природы выборочной дисперсии рекомендуется также проверить расчетным способом баланс дисперсий:
(9.6)
Случайный характер значений переменных X и Y в выборке предопределяет значения полученных параметров регрессии b1 и b2. Эти коэффициенты, вычисленные с помощью метода наименьших квадратов, представляют собой особую форму случайной величины. Они описывают соответствующие истинные коэффициенты и лишь отчасти, имея в себе влияние случайного члена .
Введем формулы для оценки стандартного отклонения функции плотности вероятности только для коэффициента регрессии b2:
(9.7)
(9.8)
где – несмещенная оценка теоретической дисперсии случайного члена .
Используя значения стандартных ошибок коэффициентов регрессии, можно судить о степени их точности лишь в общих чертах, так как невозможно знать, где именно находятся найденные коэффициенты b1 и b2 – в середине распределения или в «хвосте»?
На следующем этапе можно начать статистическое исследование с целью проверки гипотезы о значимости линейной зависимости между двумя переменными. Гипотеза, которую необходимо проверить, является нулевой гипотезой. Она состоит в том, что β2 равняется нулю. Это означает, что угловой коэффициент, равный нулю, показывает отсутствие линейной связи между переменными. Естественно, нулевая гипотеза в данном случае выдвигается с осознанным намерением максимально строго проверить ее и конечно же опровергнуть, так как надежда всего исследования заключается в том, что исследуемая переменная Y все же зависит от переменной X. Поэтому также определяется альтернативная гипотеза, которая представляет заключение, делаемое в том случае, если экспериментальная проверка указала на ложность H0. В данном случае эта гипотеза состоит в том, что β2 не равна нулю. Таким образом, можно сформулировать две гипотезы с использованием следующих обозначений:
(9.9)
Далее нужно определить величину z на основе использования стандартной ошибки с.о.(b2). Эта величина получила название «t-статистика».
(9.10)
Нужно установить критический уровень t-статистики для того, чтобы либо опровергнуть, либо принять нулевую гипотезу. Как видно из формулы 9.10, t-статистика показывает число стандартных ошибок между регрессионной оценкой и гипотетическим значением для β2. Следовательно, условием того, что оценка регрессии не должна приводить к отказу от нулевой гипотезы , будет следующее:
(9.11)
Иными словами, правилом для принятия решения является: H0 отвергается, если абсолютная величина z будет больше значения tкрит, и не отвергается в обратном случае. Критические значения t зависят от уровня значимости гипотезы и числа степеней свободы. Величины tкрит можно узнать в статистических справочниках.
Если результат оценивания регрессии подтвердит, что между переменными существует связь, то есть на исследуемую переменную Y определенно влияет независимая переменная X, то в дальнейшем можно провести исследование на оценку доверительного интервала, в котором с определенной вероятностью должен находиться гипотетический коэффициент β2. В этом случае статистическая проверка гипотезы проводится уже после самого эконометрического вывода коэффициентов регрессии.
Для этого необходимо выявить такие совместимые с имеющейся оценкой b2 значения β2, которые будут удовлетворять следующему соотношению:
(9.12)
Множество всех этих значений, определенных как интервал между нижней и верхней границами неравенства, и называется доверительным интервалом для величины β2.
|
|
Для проверки качества оценивания случайной величины Y можно применить F-статистику, основанную на анализе дисперсии. Она находится как отношение объясненной суммы квадратов в расчете на одну незвасимую переменную к остаточной сумме квадратов в расчете на одну степень свободы:
(9.13)
Далее нужно принять нулевую гипотезу о том, что связь между Y и X отсутствует, т.е. H0: β2 = 0. Затем на основе уже найденного значения R2 рассчитывается F-критерий. После его нахождения нужно отыскать критическое значение F в соответствующей таблице F-распределения. Если найденное значение F больше критического, то нулевая гипотеза об отсутствии связи между Y и X отклоняется и делается вывод о том, что имеющееся в изучаемой регрессионной модели «объяснение» поведения величины Y лучше, чем можно было бы получить чисто случайно.[9]
В качестве объекта в данном исследовании будет использоваться статистические данные, полученные при расчетах теплообменных аппаратов таблица 9.1. Применяя теорию парного регрессионного анализа, построим практическую модель для исследуемой эмпирической выборки значений Х и Y.
Таблица 9.1 Данные предела прочности стали и коэффициента теплопроводности.
Марка стали | Максимальный предел прочности | Средне статистический предел прочности | Отношение максимального предела прочности к среднестатистическому | Коэффициент теплопрово дности |
| Xmax | Xсред | Хi=Xmax/Xсред | Yi |
15л | 40 | 50,111 | 0,798 | 1,068 |
20л | 42 | 50,111 | 0,838 | 1,055 |
25л | 45 | 50,111 | 0,898 | 1,209 |
30л | 48 | 50,111 | 0,957 | 1,071 |
35л | 50 | 50,111 | 0,997 | 0,905 |
40л | 53 | 50,111 | 1,057 | 0,928 |
45л | 55 | 50,111 | 1,097 | 0,931 |
50л | 58 | 50,111 | 1,157 | 1,049 |
55л | 60 | 50,111 | 1,197 | 0,93 |
Прежде всего, необходимо найти коэффициенты регрессии. Необходимые для этого расчеты представлены в таблице 9.2.
Таблица 9.2 – Определение коэффициентов регрессии
Марка стали | ||||||||
15л | 0,798 | 1,068 | -0,202 | 0,052 | -0,010 | 0,04062 | ||
20л | 0,838 | 1,055 | -0,162 | 0,039 | -0,006 | 0,02610 | ||
25л | 0,898 | 1,209 | -0,102 | 0,193 | -0,020 | 0,01031 | ||
30л | 0,957 | 1,071 | -0,043 | 0,055 | -0,002 | 0,00181 | ||
35л | 0,997 | 0,905 | -0,003 | -0,111
| 0,000 | 0,00001 | ||
40л | 1,057 | 0,928 | 0,057 | -0,088 | -0,005 | 0,00330 | ||
45л | 1,097 | 0,931 | 0,097 | -0,085 | -0,008 | 0,00950 | ||
50л | 1,157 | 1,049 | 0,157 | 0,033 | 0,005 | 0,02479 | ||
55л | 1,197 | 0,93 | 0,197 | -0,086 | -0,017 | 0,03898 | ||
Сумма | 8,996 | 9,146 | 0 | 0 | -0,064 | 0,15542 | ||
Среднее | 1,000 | 1,0162 |
|
| -0,00706 | 0,01727 |
Далее по формулам 9.3 и 9.4 найдем коэффициенты b2 и b1:
b2 = -0,00706/0,01727= - 0,409
b1 = 1,0162-1*(- 0,409) =1,4252.
На рисунке 9.1 представлено корреляционное поле, на котором изображены точки с координатами изучаемых случайных переменных, а также прямая линия регрессии Y|i=- 0,409х + 1,4252.
Рисунок 9.1 – Линия регрессии
Как видно из рисунка, качество регрессии достаточно высокое, так как мало значение дисперсии остатков, т.е. расхождений между и . Для установления значения уровня достоверности аппроксимации необходимо рассчитать коэффициент детерминации R2. Все необходимые для этого расчеты представлены в таблице 9.3.
Таблица 9.3 – Расчет вариаций
Марка стали |
|
|
|
|
|
|
|
| |
15л | 1,068 | 1,0988 | 0,0518 | 0,0826 | -0,0308 | 0,0027 | 0,0068 | 0,0009 | |
20л | 1,055 | 1,0825 | 0,0388 | 0,0662 | -0,0275 | 0,0015 | 0,0044 | 0,0008 | |
25л | 1,209 | 1,0580 | 0,1928 | 0,0417 | 0,1510 | 0,0372 | 0,0017 | 0,0228 | |
30л | 1,071 | 1,0335 | 0,0548 | 0,0172 | 0,0375 | 0,0030 | 0,0003 | 0,0014 | |
35л | 0,905 | 1,0171 | -0,1112 | 0,0009 | -0,1121 | 0,0124 | 0,0000 | 0,0126 | |
40л | 0,928 | 0,9926 | -0,0882 | -0,0236 | -0,0646 | 0,0078 | 0,0006 | 0,0042 | |
45л | 0,931 | 0,9763 | -0,0852 | -0,0399 | -0,0453 | 0,0073 | 0,0016 | 0,0021 | |
50л | 1,049 | 0,9518 | 0,0328 | -0,0644 | 0,0972 | 0,0011 | 0,0042 | 0,0094 | |
55л | 0,93 | 0,9355 | -0,0862 | -0,0808 | -0,0055 | 0,0074 | 0,0065 | 0,000030 | |
Сумма | 9,146 | 9,1460 | 0,0000 | 0,0000 | 0,0000 | 0,0803 | 0,0261 | 0,05428 | |
Среднее | 1,02 | 1,02 | 0,0089 | 0,0029 | 0,0060 |
R2 = 0,0029/0,0089= 0,32381
Таким образом установлено, что аппроксимация достоверна практически на 32,5% (доля объясненной части дисперсии случайной величины Y).
Далее нужно статистически проверить гипотезу о значимости линейной зависимости между двумя переменными X и Y. Выдвигаем нулевую гипотезу, которая состоит в том, что β2 равняется нулю. Это означает, что между отношением предела прочности стали и коэффициентом теплопроводности нет никакой связи. Естественно, нулевая гипотеза выдвигается с намерением проверить ее и конечно же опровергнуть, так как надежда всего исследования заключается в том, что связь все-таки есть. Кроме того, сформулируем альтернативную гипотезу о наличии такой связи.
Далее по формуле 9.7 рассчитывается стандартная ошибка углового коэффициента b2. Для этого по формуле 9.8 находим – несмещенную оценку теоретической дисперсии случайного члена .
= 0,05428/(9–2) = 0,007754;
c.o(b2)= =0,2233
На основе стандартной ошибки с.о.(b2) по формуле 9.10 получим значение t-статистики углового коэффициента b2:
z = (- 0,409– 0)/ 0,2233= -1,83
Для того чтобы принять или опровергнуть нулевую гипотезу об отсутствии связи нужно найти критическое значение t-распределения. Это можно сделать с помощью функции СТЬЮДРАСПОБР в программе MS Excel. В анализируемом примере число степеней свободы составляет 7 (9-2). Сначала проверим значимость коэффициента b2 с 95-процентной вероятностью:
tкрит (чсс=7; α=0,05) =2,364624251
Так как имеющаяся t-статистика углового коэффициента b2 (-1,83) не удовлетворяет условию 9.13, то есть она меньше по модулю чем критическое значение t-статистики, поэтому следует не отвергать нулевую гипотезу. Таким образом, с 95-процентной вероятностью можно констатировать факт того, что связь между пределом прочности и коэффициентом теплопроводности может быть подтверждена статистической проверкой.
В заключении следует проверить качество нашего оценивания случайной величины Y при помощи F-статистики, которая находится по данным таблицы 9.2 и по формуле 9.13:
F=3,352137111
Снова формулируется нулевая гипотеза о том, что связь между Y и X отсутствует, т.е. H0: β2 = 0. Затем находится критическое значение таблице F-распределения. Это можно сделать с помощью функции FРАСПОБР в программе MS Excel.
Fкрит (чсс1 = 1; чсс2 =7; α=0,05) = 5,591447848
Как видно, имеющееся значение F (3,352137111) меньше критического, значит нулевая гипотеза об отсутствии связи между Y и X подтверждается.